返回 Skill 列表
extension
分类: 其它需要 API Key

创视界-图片生成

当智能体需要调用创视界 Future Vision 生成图片、图生图、图片模板或队列式自定义图片任务,且用户需求不是视频生成时使用。

person作者: user_475a117fhubcommunity

创视界-图片生成

概述

本技能用于通过 https://future-vision.vodeshop.com 调用创视界自定义图片生成功能。后端会创建 custom_image_task,扣除对应点数,并进入图片生成队列;创建成功不代表图片已经完成,后续必须查询任务状态。

安装、认证、CLI 示例、HTTP 接口映射和轮询示例见 docs/openclaw-sora-custom-generation-guide.md

必填参数

  • prompt:图片提示词。
  • modelType:稳定枚举为 normal2k4k。CLI 也接受展示名称并自动归一,例如 FE-image -> normalFE-banana -> 2kdoubao-5.0 -> 4k
  • size:建议使用 original1:13:44:316:99:16。旧字段 aspectRatio 仍兼容。

可选参数:

  • resolution:当后台配置开放分辨率选择时,可传 1K2K3K4K
  • inputImageUrl / inputImageId:单张参考图。
  • inputImages:有序参考图数组,例如 { "id": "...", "url": "...", "source": "upload|library|creative" }
  • templateId:从图片模板生成时必须保留。

执行流程

  1. 先确认用户要的是图片输出;如果用户要视频,交给 future-vision-video-generation
  2. 收集 promptmodelTypesizeaspectRatio
  3. 如果缺少必填字段,每次只询问一个字段,并输出 [SORA_MISSING_PARAM]。不要同时询问模型和尺寸。
  4. 当用户说 FE-image 时,默认按 modelType=normal 处理,除非实时后台配置另有变化。
  5. 保留 inputImages 的顺序,不要把多张参考图随意压成一张 URL。
  6. 构造 JSON 后调用:
node scripts/future-vision.mjs custom-image create --input payload.json --pretty
  1. 返回 CLI 的 JSON 结果。如果任务还未完成,额外输出 [SORA_TRACK],方便前端或其他智能体继续轮询。
  2. 后续进度查询使用 custom-image getcustom-image queue 只用于队列诊断,不作为主要进度接口。

常用命令

node scripts/future-vision.mjs custom-image create --input payload.json --pretty
node scripts/future-vision.mjs custom-image get --task-id <taskId> --pretty
node scripts/future-vision.mjs custom-image queue --pretty

只有当调用方明确希望阻塞等待时,才追加 --wait

缺参提示格式

[SORA_MISSING_PARAM]
workflow: sora-custom-image
missingField: modelType
options: normal | 2k | 4k
nextAction: wait_for_user_selection
[/SORA_MISSING_PARAM]

展示名称可以用于用户界面,但请求载荷建议使用稳定枚举:FE-image -> normalFE-banana -> 2kdoubao-5.0 -> 4k

[SORA_MISSING_PARAM]
workflow: sora-custom-image
missingField: size
options: original | 1:1 | 3:4 | 4:3 | 16:9 | 9:16
nextAction: wait_for_user_selection
[/SORA_MISSING_PARAM]

如果缺少 prompt,不要给固定选项,只提出一个简短问题等待用户补充。

请求示例

{
  "prompt": "干净的产品海报,白色背景,柔和阴影,高级电商质感",
  "modelType": "normal",
  "resolution": "2K",
  "size": "1:1",
  "inputImages": [
    {
      "id": "asset-001",
      "url": "https://cdn.example.com/ref.png",
      "source": "upload"
    }
  ],
  "templateId": "optional-image-template-id"
}

轮询标记

[SORA_TRACK]
workflow: sora-custom-image
resourceType: custom_image_task
resourceId: <taskId>
taskId: <taskId>
workId: <none>
status: pending | processing | queued
queuePosition: <number | unknown>
[/SORA_TRACK]

当前后端行为

  • size=original 表示在适配器支持时使用原图尺寸。
  • 分辨率和尺寸选项由后台按模型版本配置;如果后端拒绝某个值,应展示后端错误并让用户选择支持项。
  • 豆包图片生成默认发送 watermark: false
  • 图片编辑接口会保持 inputImages 顺序,并以 image[] 形式提交文件。
  • 队列会返回 queuePosition;最终状态通过 custom-image get --task-id <taskId> 查询。

注意事项

  • 不要用本技能处理视频或图生视频;这类需求交给 future-vision-video-generation
  • 创建任务后不要立即宣称图片已完成。
  • 不要在技能内硬编码完整后台配置矩阵,只保留安全常用选项,让后端负责最终校验。
  • 不要重排参考图,顺序可能影响编辑模型结果。
  • 如果 CLI 返回 AUTH_REQUIRED、提示缺少 FUTURE_VISION_JWT / 旧版 SORA_JWT,或后端返回 401,按 docs/openclaw-sora-auth.md 保存 API KEY 后重试同一条命令。

参考文件