← 返回 Skill 列表

extension

分类: 其它需要 API Key

创视界-图片生成

当智能体需要调用创视界 Future Vision 生成图片、图生图、图片模板或队列式自定义图片任务，且用户需求不是视频生成时使用。

创视界-图片生成

概述

本技能用于通过 https://future-vision.vodeshop.com 调用创视界自定义图片生成功能。后端会创建 custom_image_task，扣除对应点数，并进入图片生成队列；创建成功不代表图片已经完成，后续必须查询任务状态。

安装、认证、CLI 示例、HTTP 接口映射和轮询示例见 docs/openclaw-sora-custom-generation-guide.md。

必填参数

prompt：图片提示词。
modelType：稳定枚举为 normal、2k、4k。CLI 也接受展示名称并自动归一，例如 FE-image -> normal、FE-banana -> 2k、doubao-5.0 -> 4k。
size：建议使用 original、1:1、3:4、4:3、16:9、9:16。旧字段 aspectRatio 仍兼容。

可选参数：

resolution：当后台配置开放分辨率选择时，可传 1K、2K、3K、4K。
inputImageUrl / inputImageId：单张参考图。
inputImages：有序参考图数组，例如 { "id": "...", "url": "...", "source": "upload|library|creative" }。
templateId：从图片模板生成时必须保留。

执行流程

先确认用户要的是图片输出；如果用户要视频，交给 future-vision-video-generation。
收集 prompt、modelType、size 或 aspectRatio。
如果缺少必填字段，每次只询问一个字段，并输出 [SORA_MISSING_PARAM]。不要同时询问模型和尺寸。
当用户说 FE-image 时，默认按 modelType=normal 处理，除非实时后台配置另有变化。
保留 inputImages 的顺序，不要把多张参考图随意压成一张 URL。
构造 JSON 后调用：

node scripts/future-vision.mjs custom-image create --input payload.json --pretty

返回 CLI 的 JSON 结果。如果任务还未完成，额外输出 [SORA_TRACK]，方便前端或其他智能体继续轮询。
后续进度查询使用 custom-image get；custom-image queue 只用于队列诊断，不作为主要进度接口。

常用命令

node scripts/future-vision.mjs custom-image create --input payload.json --pretty
node scripts/future-vision.mjs custom-image get --task-id <taskId> --pretty
node scripts/future-vision.mjs custom-image queue --pretty

只有当调用方明确希望阻塞等待时，才追加 --wait。

缺参提示格式

[SORA_MISSING_PARAM]
workflow: sora-custom-image
missingField: modelType
options: normal | 2k | 4k
nextAction: wait_for_user_selection
[/SORA_MISSING_PARAM]

展示名称可以用于用户界面，但请求载荷建议使用稳定枚举：FE-image -> normal、FE-banana -> 2k、doubao-5.0 -> 4k。

[SORA_MISSING_PARAM]
workflow: sora-custom-image
missingField: size
options: original | 1:1 | 3:4 | 4:3 | 16:9 | 9:16
nextAction: wait_for_user_selection
[/SORA_MISSING_PARAM]

如果缺少 prompt，不要给固定选项，只提出一个简短问题等待用户补充。

请求示例

{
  "prompt": "干净的产品海报，白色背景，柔和阴影，高级电商质感",
  "modelType": "normal",
  "resolution": "2K",
  "size": "1:1",
  "inputImages": [
    {
      "id": "asset-001",
      "url": "https://cdn.example.com/ref.png",
      "source": "upload"
    }
  ],
  "templateId": "optional-image-template-id"
}

轮询标记

[SORA_TRACK]
workflow: sora-custom-image
resourceType: custom_image_task
resourceId: <taskId>
taskId: <taskId>
workId: <none>
status: pending | processing | queued
queuePosition: <number | unknown>
[/SORA_TRACK]

当前后端行为

size=original 表示在适配器支持时使用原图尺寸。
分辨率和尺寸选项由后台按模型版本配置；如果后端拒绝某个值，应展示后端错误并让用户选择支持项。
豆包图片生成默认发送 watermark: false。
图片编辑接口会保持 inputImages 顺序，并以 image[] 形式提交文件。
队列会返回 queuePosition；最终状态通过 custom-image get --task-id <taskId> 查询。

注意事项

不要用本技能处理视频或图生视频；这类需求交给 future-vision-video-generation。
创建任务后不要立即宣称图片已完成。
不要在技能内硬编码完整后台配置矩阵，只保留安全常用选项，让后端负责最终校验。
不要重排参考图，顺序可能影响编辑模型结果。
如果 CLI 返回 AUTH_REQUIRED、提示缺少 FUTURE_VISION_JWT / 旧版 SORA_JWT，或后端返回 401，按 docs/openclaw-sora-auth.md 保存 API KEY 后重试同一条命令。

参考文件

references/contract.md：创建和轮询命令契约。
docs/openclaw-sora-custom-generation-guide.md：第三方安装和调用示例。
docs/openclaw-sora-cli-design.md：共享 CLI 行为。
docs/openclaw-sora-auth.md：认证初始化和恢复流程。