创视界-图片生成
概述
本技能用于通过 https://future-vision.vodeshop.com 调用创视界自定义图片生成功能。后端会创建 custom_image_task,扣除对应点数,并进入图片生成队列;创建成功不代表图片已经完成,后续必须查询任务状态。
安装、认证、CLI 示例、HTTP 接口映射和轮询示例见 docs/openclaw-sora-custom-generation-guide.md。
必填参数
prompt:图片提示词。modelType:稳定枚举为normal、2k、4k。CLI 也接受展示名称并自动归一,例如FE-image -> normal、FE-banana -> 2k、doubao-5.0 -> 4k。size:建议使用original、1:1、3:4、4:3、16:9、9:16。旧字段aspectRatio仍兼容。
可选参数:
resolution:当后台配置开放分辨率选择时,可传1K、2K、3K、4K。inputImageUrl/inputImageId:单张参考图。inputImages:有序参考图数组,例如{ "id": "...", "url": "...", "source": "upload|library|creative" }。templateId:从图片模板生成时必须保留。
执行流程
- 先确认用户要的是图片输出;如果用户要视频,交给
future-vision-video-generation。 - 收集
prompt、modelType、size或aspectRatio。 - 如果缺少必填字段,每次只询问一个字段,并输出
[SORA_MISSING_PARAM]。不要同时询问模型和尺寸。 - 当用户说
FE-image时,默认按modelType=normal处理,除非实时后台配置另有变化。 - 保留
inputImages的顺序,不要把多张参考图随意压成一张 URL。 - 构造 JSON 后调用:
node scripts/future-vision.mjs custom-image create --input payload.json --pretty
- 返回 CLI 的 JSON 结果。如果任务还未完成,额外输出
[SORA_TRACK],方便前端或其他智能体继续轮询。 - 后续进度查询使用
custom-image get;custom-image queue只用于队列诊断,不作为主要进度接口。
常用命令
node scripts/future-vision.mjs custom-image create --input payload.json --pretty
node scripts/future-vision.mjs custom-image get --task-id <taskId> --pretty
node scripts/future-vision.mjs custom-image queue --pretty
只有当调用方明确希望阻塞等待时,才追加 --wait。
缺参提示格式
[SORA_MISSING_PARAM]
workflow: sora-custom-image
missingField: modelType
options: normal | 2k | 4k
nextAction: wait_for_user_selection
[/SORA_MISSING_PARAM]
展示名称可以用于用户界面,但请求载荷建议使用稳定枚举:FE-image -> normal、FE-banana -> 2k、doubao-5.0 -> 4k。
[SORA_MISSING_PARAM]
workflow: sora-custom-image
missingField: size
options: original | 1:1 | 3:4 | 4:3 | 16:9 | 9:16
nextAction: wait_for_user_selection
[/SORA_MISSING_PARAM]
如果缺少 prompt,不要给固定选项,只提出一个简短问题等待用户补充。
请求示例
{
"prompt": "干净的产品海报,白色背景,柔和阴影,高级电商质感",
"modelType": "normal",
"resolution": "2K",
"size": "1:1",
"inputImages": [
{
"id": "asset-001",
"url": "https://cdn.example.com/ref.png",
"source": "upload"
}
],
"templateId": "optional-image-template-id"
}
轮询标记
[SORA_TRACK]
workflow: sora-custom-image
resourceType: custom_image_task
resourceId: <taskId>
taskId: <taskId>
workId: <none>
status: pending | processing | queued
queuePosition: <number | unknown>
[/SORA_TRACK]
当前后端行为
size=original表示在适配器支持时使用原图尺寸。- 分辨率和尺寸选项由后台按模型版本配置;如果后端拒绝某个值,应展示后端错误并让用户选择支持项。
- 豆包图片生成默认发送
watermark: false。 - 图片编辑接口会保持
inputImages顺序,并以image[]形式提交文件。 - 队列会返回
queuePosition;最终状态通过custom-image get --task-id <taskId>查询。
注意事项
- 不要用本技能处理视频或图生视频;这类需求交给
future-vision-video-generation。 - 创建任务后不要立即宣称图片已完成。
- 不要在技能内硬编码完整后台配置矩阵,只保留安全常用选项,让后端负责最终校验。
- 不要重排参考图,顺序可能影响编辑模型结果。
- 如果 CLI 返回
AUTH_REQUIRED、提示缺少FUTURE_VISION_JWT/ 旧版SORA_JWT,或后端返回401,按 docs/openclaw-sora-auth.md 保存 API KEY 后重试同一条命令。
参考文件
- references/contract.md:创建和轮询命令契约。
- docs/openclaw-sora-custom-generation-guide.md:第三方安装和调用示例。
- docs/openclaw-sora-cli-design.md:共享 CLI 行为。
- docs/openclaw-sora-auth.md:认证初始化和恢复流程。
微信扫一扫