Seedance 2.0 Video Generation

Setup

API key: $SEEDANCE_2_API_KEY (fallback: $ARK_API_KEY)
CLI: seedance2 (at scripts/seedance2.py, symlinked to ~/.local/bin/seedance2)
No external Python dependencies — uses only stdlib (urllib, json, base64, argparse)

CLI Usage

# Text-to-video
seedance2 t2v "一只猫在弹钢琴" --duration 8 --ratio 16:9

# Image → video (first frame)
seedance2 i2v photo.jpg "camera slowly zooms out"

# Image → video (first + last frame)
seedance2 i2v first.jpg last.jpg "smooth transition"

# Multi-modal reference (images + videos + audio)
seedance2 ref "广告视频" -i product.jpg -i logo.png -v reference.mp4 -a bgm.mp3

# Edit existing video
seedance2 edit "把视频里的猫换成狗" -v source.mp4 -i dog.jpg

# Extend / concatenate videos
seedance2 ext "镜头继续向前推进" -v clip1.mp4 -v clip2.mp4

# Query task status
seedance2 status cgt-20260316-xxxxx

# Wait for completion + download
seedance2 wait cgt-20260316-xxxxx -o output.mp4

Common Options

| Flag | Default | Description | |------|---------|-------------| | --model fast | 2.0 | Use 2.0 fast (faster, cheaper) | | --ratio | adaptive | 16:9 4:3 1:1 3:4 9:16 21:9 | | --duration N | 5 | 4-15 seconds, or -1 for auto | | --resolution | 720p | 480p or 720p | | --no-audio | audio on | Disable audio generation | | --web-search | off | Enable web search (t2v only) | | --no-watermark | watermark on | Remove watermark | | -o FILE | — | Download output to file | | --wait | — | Auto-wait for completion | | --poll N | 15 | Poll interval in seconds |

Input Formats

All media arguments accept three formats:

Local file — auto base64-encoded (e.g. ./photo.jpg)
Public URL — passed through (e.g. https://example.com/img.jpg)
Asset URI — virtual avatar from 方舟 (e.g. asset://asset-20260224-xxxxx)

Workflow Pattern

Typical generation workflow:

Create task → get task_id
Poll status every 15-30s until succeeded
Download video (URL expires in 24h)

The --wait flag or seedance2 wait command handles steps 2-3 automatically.

Generation Modes — Decision Guide

| Need | Command | Key constraint | |------|---------|----------------| | Pure text prompt | t2v | Supports --web-search | | Control first frame precisely | i2v (1 image) | 1 image only | | Control first + last frame | i2v (2 images) | Exactly 2 images | | Style/character/scene references | ref | Up to 9 images + 3 videos + 3 audio | | Modify existing video | edit | Source video + reference images + instruction | | Stitch / continue videos | ext | Up to 3 videos, total ≤15s |

⚠️ i2v (first/last frame) and ref (reference) modes are mutually exclusive — do not mix roles.

API Details

For full API spec (parameters, constraints, pixel dimensions, rate limits), read references/api-spec.md.

实战 prompt 模式完整模板 → references/prompt-patterns.md：

i2v 多段动作叙事（Narrative Multi-Beat）：单图驱动 8-12s 动作链
V2V 持续层 + 拍点层（Continuous + Beat-Trigger）：原片不动、叠特效层（HUD/UI/AR），按时间码 0.04s 精度触发事件
空间区域分锁（Spatial Region Lock）：单帧画面里只动一部分（局部绿幕、窗外景色、画中画），用 SCENE GEOMETRY + Region A/B/C 索引模板

Prompt Craft

通用 prompt 方法论（敏感度模型、7层结构、人物/场景/动作模板）→ 见 prompt-craft skill 本节只覆盖 Seedance 2.0 特有的 prompt 技巧。

Seedance 特有 Prompt 技巧

多模态参考 > 文字描述：有参考图/视频时，文字 prompt 只负责描述“这次要做什么变化”，不要重复参考素材已经表达的内容。

运动描述词：Seedance 对物理运动词汇敏感。用动词+方向+速度，不用形容词。

✅ "camera pushes forward through the corridor, accelerating"
❌ "dynamic cinematic movement"

音频引导：用 -a 传入参考音频时，prompt 里不需要再描述音乐风格——模型会从音频推断节奏和情绪。

否定约束：Seedance 对否定词的响应比图片模型更弱。最多1-2条，或者干脆不写。

运动品牌广告理论（案例研究）

来源：2026-03-29 实拍分析。不要背 prompt，要理解结构。

核心叙事结构：能量积累 → 品牌具象化 → 产品揭示

这是运动广告的经典三段式：

能量蓄积：用环境/运动员/场景碎片建立情绪张力
品牌具象化：品牌符号（logo/swoosh）作为物理实体进入画面，承载前段积累的能量
产品落版：能量收束，产品完整亮相，品牌 + 产品同框收尾

运镜理论：POV 追随镜头（贴身推进）

摄影机=品牌意志：不是旁观者，而是和品牌符号同速运动
贴近主体高速前推（而非拉远俯瞰），制造「穿越空间」的侵入感
一镜到底感比实际连续更重要——感知上的连贯 > 物理上的无剪辑
沿途元素（跑道、灯光、运动员特写）是「被切开的空间」，而不是背景板

品牌符号的物化方式

品牌 logo 出现在视频里有两种层次：

低层次：片尾贴一个静态 logo（广告惯例）
高层次：logo 成为有物理质感的能量实体，「吸附」环境纹理，像刀切开空间

Prompt 中要明确赋予 logo 质感（金属/空气刃/光轨）和行为（飞出/切开/吸附），而不只是"出现"。

声音设计原则：纯音效，零 BGM

反直觉但有效：去掉背景音乐，只保留现场音效（呼吸、鞋底摩擦、面料抖动、空气断裂），反而更有冲击力。

原因：

BGM 把情绪「外包」给音乐，削弱画面本身的力量
纯音效让观众感觉「在场」，提升真实感和沉浸度
Seedance 的原生音频在这类场景表现好，值得利用

Prompt 写法：明确排除"背景音乐/BGM"，列举保留的具体音效类型。

材质感 = 可信度

产品广告的说服力来自材质感的堆叠：

鞋底橡胶纹路、面料纤维、气垫结构
光打在材质上的反射/折射
运动员皮肤/汗水/表情特写

Prompt 中不要只说「展示一双鞋」，要说出你要看到什么材质反应。

Prompt 构建模板

[质感定位] + [运镜方式] + [品牌符号行为] + [场景碎片列举] + [产品落版] + [声音指令]

示例填法：

质感定位：「电影级/超写实/高速感」
运镜方式：「第一人称追随镜头/贴着主体前冲/一镜到底感」
品牌符号行为：「像XXX切开空间/吸附画面碎片/最终具象成产品」
场景碎片：越具体越好（球场灯光/跑道线/运动员面部/鞋底特写）
声音指令：「不要BGM，只保留[具体音效]」