Vidu Video Generate 🎬
Vidu AI 视频生成工具,专注于视频生成功能。
环境说明
变量说明:
{baseDir}- 运行时自动替换为本 skill 目录的绝对路径- 实际路径:
~/.openclaw/workspace/skills/vidu-video-generate/
- 实际路径:
环境变量:
VIDU_API_KEY- Vidu API 密钥(必需)
快速开始
直接告诉我你想生成什么视频,我会自动识别并调用合适的接口:
"生成一只猫咪在阳光下打哈欠的视频"
"把这个图片变成视频,让人物转头微笑"
"用这两张图生成一个合照视频"
"用首尾帧图片生成过渡动画"
支持的视频类型
| 类型 | 触发条件 | 说明 | |------|----------|------| | 文生视频 | 纯文字描述 | 从文字生成视频 | | 图生视频 | 提供图片 + 描述 | 图片作为首帧生成视频 | | 参考生视频 | 多张图片 | 多人/多主体视频 | | 首尾帧视频 | 提供首帧+尾帧图片 | 过渡动画视频 |
自动识别规则
用户输入 → 意图识别
─────────────────────────────
纯文字描述 → 文生视频 (text2video)
单张图片 + 描述 → 图生视频 (img2video)
多张图片 → 参考生视频 (ref2video)
首帧 + 尾帧 → 首尾帧视频 (start-end2video)
模型选择策略
文生视频模型
| 模型 | 时长范围 | 分辨率 | 特点 | |------|----------|--------|------| | viduq3-pro-fast | 默认5秒,可选1-16秒 | 默认720p,可选720p/1080p | 支持音画同步,支持视频分镜,效果对标viduq3-pro,生成速度更快 | | viduq3-turbo | 默认5秒,可选1-16秒 | 默认720p,可选540p/720p/1080p | 支持音画同步,支持视频分镜,生成速度更快 | | viduq3-pro | 默认5秒,可选1-16秒 | 默认720p,可选540p/720p/1080p | 支持音画同步,支持视频分镜,效果更好 | | viduq2 | 默认5秒,可选1-10秒 | 默认720p,可选540p/720p/1080p | 最新模型,情绪表达强,细节更丰富 | | viduq1 | 固定5秒 | 固定1080p | 画面清晰,平滑转场,运镜稳定 |
图生视频模型
必须输入1张图片
| 模型 | 时长范围 | 分辨率 | 特点 | |------|----------|--------|------| | viduq3-pro-fast | 默认5秒,可选1-16秒 | 默认720p,可选720p/1080p | 支持音画同步,支持生成分镜视频,效果对标viduq3-pro,生成速度最快 | | viduq3-turbo | 默认5秒,可选1-16秒 | 默认720p,可选540p/720p/1080p | 支持音画同步,支持生成分镜视频,生成速度更快 | | viduq3-pro | 默认5秒,可选1-16秒 | 默认720p,可选540p/720p/1080p | 支持音画同步,支持生成分镜视频,效果更好 | | viduq2-pro-fast | 默认5秒,可选1-10秒 | 默认720p,可选720p/1080p | 价格触底、效果好,生成速度在q2-turbo基础上提升2-3倍 | | viduq2-pro | 默认5秒,可选1-10秒 | 默认720p,可选540p/720p/1080p | 新模型,情感表达强,动态细节丰富 | | viduq2-turbo | 默认5秒,可选1-10秒 | 默认720p,可选540p/720p/1080p | 新模型,效果好,生成快 | | viduq1 | 固定5秒 | 固定1080p | 画面清晰,平滑转场,运镜稳定 | | viduq1-classic | 固定5秒 | 固定1080p | 画面清晰,转场、运镜更丰富 | | vidu2.0 | 默认4秒,可选4/8秒 | 4秒:默认360p,可选360p/720p/1080p<br>8秒:默认720p,可选720p | 生成速度快 |
参考生视频模型
| 模型 | 图片上限 | 时长范围 | 分辨率 | 特点 | |------|----------|----------|--------|------| | viduq3-beta | 5张 | 3-10秒 | 默认720p,可选540p/720p/1080p | 默认,最新模型,支持音画同出,智能切镜 | | viduq3 | 7张 | 3-16秒 | 默认720p,可选540p/720p/1080p | 多人场景,智能切镜,支持更多图片 | | viduq2-pro | 7张 | 1-10秒* | 默认720p,可选540p/720p/1080p | 支持参考视频,支持视频编辑,视频替换 | | viduq2 | 7张 | 1-10秒 | 默认720p,可选540p/720p/1080p | 动态效果好,生成细节丰富 | | viduq1 | 7张 | 5秒 | 固定1080p | 画面清晰,平滑转场,运镜稳定 | | vidu2.0 | 7张 | 4秒 | 默认360p,可选360p/720p | 生成速度快 |
*viduq2-pro:输入视频时若未指定时长,duration=0 表示智能指定时长
首尾帧视频模型
必须输入2张图片(首帧+尾帧)
| 模型 | 时长范围 | 分辨率 | 特点 | |------|----------|--------|------| | viduq3-pro-fast | 默认5秒,可选1-16秒 | 默认720p,可选720p/1080p | 支持音画同步,支持生成分镜视频,效果对标viduq3-pro,生成速度最快 | | viduq3-turbo | 默认5秒,可选1-16秒 | 默认720p,可选540p/720p/1080p | 支持音画同步,支持生成分镜视频,生成速度更快 | | viduq3-pro | 默认5秒,可选1-16秒 | 默认720p,可选540p/720p/1080p | 支持音画同步,支持生成分镜视频,效果更好 | | viduq2-pro-fast | 默认5秒,可选1-10秒 | 默认720p,可选720p/1080p | 价格触底、效果好,生成速度在q2-turbo基础上提升2-3倍 | | viduq2-pro | 默认5秒,可选1-10秒 | 默认720p,可选540p/720p/1080p | 新模型,效果好,细节丰富 | | viduq2-turbo | 默认5秒,可选1-10秒 | 默认720p,可选540p/720p/1080p | 新模型,效果好,生成快 | | viduq1 | 固定5秒 | 固定1080p | 画面清晰,平滑转场,运镜稳定 | | viduq1-classic | 固定5秒 | 固定1080p | 画面清晰,转场、运镜更丰富 | | vidu2.0 | 默认4秒,可选4/8秒 | 4秒:默认360p,可选360p/720p/1080p<br>8秒:默认720p,可选720p | 生成速度快 |
时长与分辨率默认值
视频时长:5秒
视频分辨率:720p
视频比例:16:9
API 调用
内部使用 Python CLI 工具:
# 文生视频
python3 {baseDir}/scripts/vidu_cli.py text2video --prompt "视频描述"
# 图生视频
python3 {baseDir}/scripts/vidu_cli.py img2video --image photo.jpg --prompt "描述"
# 参考生视频
python3 {baseDir}/scripts/vidu_cli.py ref2video --images img1.jpg img2.jpg --prompt "描述"
# 首尾帧视频
python3 {baseDir}/scripts/vidu_cli.py start-end2video --start-frame start.jpg --end-frame end.jpg --prompt "描述"
# 查询任务状态
python3 {baseDir}/scripts/vidu_cli.py status <task_id> --wait --download ./uploads
输出规范
- 下载目录:
{baseDir}/uploads/ - 返回格式: Markdown 格式引用文件
- 视频链接: 必须返回 Vidu API 的
creations[0].url字段
环境配置
必需环境变量:
VIDU_API_KEY=your_api_key_here
获取 API Key:
- Vidu 官方开放平台:https://platform.vidu.cn 或 https://platform.vidu.com
- 注册账号后在「API Keys」页面创建
API 域名选择
重要规则:根据用户语言自动选择 API 域名
| 用户语言 | API 域名 | 说明 |
|---------|---------|------|
| 简体中文 | api.vidu.cn | 国内用户(默认) |
| 其他语言 | api.vidu.com | 海外用户 |
Base URL 配置:
# 简体中文用户
BASE_URL = "https://api.vidu.cn/ent/v2"
# 非简体中文用户(英文、日文、韩文等)
BASE_URL = "https://api.vidu.com/ent/v2"
判断逻辑:
- 用户使用简体中文 → 使用
api.vidu.cn - 用户使用其他语言(英文、日文、韩文等) → 使用
api.vidu.com
错误处理
| 错误 | 原因 | 解决方案 | |------|------|----------| | Invalid API key | API密钥错误 | 检查 VIDU_API_KEY 环境变量 | | Image size exceeds | 图片过大 | 压缩至50MB以下 | | Task failed | 生成失败 | 查看 error 信息重试 |
References
- API参考文档 - 所有API详细参数
Rules
- API Key 检查: 调用前确认
VIDU_API_KEY已设置 - 异步任务: 视频生成异步进行,需轮询状态
- 下载时效: 生成 URL 24小时内有效
- 返回视频链接: 必须返回视频 URL 让用户直接访问
Scan to join WeChat group