README
🚀 短视频生成工具
这是一个开源的短视频生成工具,能帮助用户自动化创建专业级的短视频内容,节省时间与精力。
🚀 快速开始
本工具旨在助力用户轻松、高效地创建专业短视频。下面为你介绍不同方式的启动步骤。
✨ 主要特性
- 语音合成:借助先进的TTS技术,将文本转化为自然流畅的语音。
- 智能字幕生成:精准识别语音,并生成同步字幕。
- 视频素材获取:可从Pexels等平台获取高质量视频片段。
- 多轨道编辑:利用Remotion进行视频剪辑和特效处理。
- 自动渲染输出:一键生成完整的短视频作品。
📦 安装指南
系统要求
- 推荐配置:
- CPU:Intel i5 或更高
- GPU:NVIDIA GeForce GTX 1060 或 AMD Radeon RX 580 及以上显卡
- 内存:8GB及以上
- 显存:4GB及以上(用于GPU加速)
- 最低配置:
- CPU:Intel i3 或更高
- GPU:集成显卡支持硬件加速
- 内存:6GB及以上
- 显存:2GB及以上
安装方式
- 通过NPX运行:
npx short-video-maker
- 本地安装并运行
npm install short-video-maker -g
short-video-maker start
- Docker部署
# Dockerfile
FROM node:16
WORKDIR /app
COPY package*.json ./
RUN npm install
COPY . .
CMD ["node", "index.js"]
💻 使用示例
基础用法
{
"scenes": [
{
"text": "欢迎使用我们的短视频生成工具",
"searchTerms": ["科技感十足的开场"]
}
],
"config": {
"paddingBack": 3000,
"music": "科技范"
}
}
🔧 技术细节
| 技术组件 | 版本 | 许可证 | 功能描述 | |------------------|--------|---------------|------------------------------| | Remotion | ^4.0.286 | Remotion License | 视频合成与渲染 | | Whisper CPP | v1.5.5 | MIT | 语音识别与转录 | | FFmpeg | ^2.1.3 | LGPL/GPL | 多媒体处理 | | Kokoro.js | ^1.2.0 | MIT | 文本到语音转换 | | Pexels API | N/A | Pexels Terms | 视频素材获取 |
📚 详细文档
REST API接口
支持以下操作:
GET /api/video/:id- 获取视频详情POST /api/video- 创建新视频,请求示例:{ "scenes": [ { "text": "这里是视频的文字内容", "searchTerms": ["科技感的开场"] } ], "config": { "paddingBack": 3000, "music": "科技范" } }DELETE /api/video/:id- 删除指定视频GET /api/music-tags- 获取可用音乐标签
Model Context Protocol (MCP)
支持以下接口:
GET /mcp/sse- 服务器推送事件POST /mcp/messages- 发送控制指令
可用工具:
create-short-video:批量处理视频场景get-video-status:查询视频生成状态
📄 许可证
本项目遵循MIT License。
👏 致谢
感谢以下项目的贡献:
微信扫一扫