返回 Skill 列表
extension
分类: 其它需要 API Key

抖音爬虫

抖音无水印视频/图文/混合作品下载和文案提取工具

person作者: user_dfcfbf47hubcommunity

douyin-scraper Skill v2.0

抖音无水印作品下载工具 v2.0,支持所有作品类型。

支持的作品类型

| 类型 | 说明 | 下载内容 | :|------|------|----------| | 📷 纯图文 (note) | 多张图片的图文作品 | 所有图片 | | 🎬 纯视频 (video) | 普通视频作品 | 视频文件 | | 🎬📷 混合 (mixed) | 同一作品中包含图片和视频 | 图片 + 视频 | | 🌀 动图 (slides) | 幻灯片/动图作品 | 帧图片 + 视频 |

功能

  • 🔗 自动识别作品类型(视频/图文/混合/动图)
  • 📥 统一下载:将所有媒体(图片+视频)按序号保存
  • 🎬 获取无水印视频下载链接
  • 📷 下载图文作品的所有图片
  • 🎙️ 从视频中提取语音文案(需要 API Key)
  • 🔄 多源降级:iesdouyin → douyin 网页 → API,确保解析成功

环境变量

  • DOUYIN_API_KEYAPI_KEY - 硅基流动 API 密钥(用于语音转文字)

获取 API Key: https://cloud.siliconflow.cn/

使用方法

获取作品信息(自动识别类型)

node ~/.workbuddy/skills/douyin-scraper/douyin_scraper.js info "抖音分享链接"

下载作品(自动处理所有媒体)

node ~/.workbuddy/skills/douyin-scraper/douyin_scraper.js download "抖音链接" -o ./douyin-scraper-downloads

提取文案(仅视频部分,需要 API Key)

export DOUYIN_API_KEY="your-api-key"
node ~/.workbuddy/skills/douyin-scraper/douyin_scraper.js extract "抖音链接" -o ./douyin-scraper-downloads

支持的链接格式

  • 抖音分享短链: https://v.douyin.com/xxx
  • 抖音视频页: https://www.douyin.com/video/xxx
  • 抖音图文页: https://www.douyin.com/note/xxx
  • 分享口令文本(自动提取其中的链接)

输出结构

所有媒体保存在 douyin-scraper-downloads/YYYYMMDD_作者_标题/ 目录下, 文件名统一采用 作者_标题[_序号].扩展名 格式。

douyin-scraper-downloads/
├── 20260521_张三_搞笑日常/              # 单视频("张三_搞笑日常"=7字符)
│   ├── 张三_搞笑日常.mp4
│   └── transcript.md                    # extract 模式才有
├── 20260521_李四_今日穿搭/              # 多图图文
│   ├── 李四_今日穿搭_01.jpeg
│   ├── 李四_今日穿搭_02.jpeg
│   ├── 李四_今日穿搭_03.jpeg
│   └── 李四_今日穿搭_04.jpeg
├── 20260521_王五_旅游vlog/              # 混合(多视频 + 多图)
│   ├── 王五_旅游vlog_01.mp4
│   ├── 王五_旅游vlog_02.mp4
│   ├── 王五_旅游vlog_01.jpeg
│   └── 王五_旅游vlog_02.jpeg
└── 20260521_长名字_这个标/              # 截断示例(作者"长名字博主"4字 + 标题"这个标题非常长"截到剩余 5 字)
    └── 长名字_这个标.mp4

命名规则

  • 目录名:YYYYMMDD_作者_标题,其中"作者_标题"合起来 不超过 35 个字符(下划线占 1 个)
  • 单视频/单图:作者_标题.mp4 / 作者_标题.jpeg
  • 多视频/多图:作者_标题_01.mp4作者_标题_02.mp4...(序号补零)
  • 截断策略:作者超过 12 字截到 12 字,剩余长度给标题;只有作者或只有标题时该字段独占 35 字
  • 冲突时目录名自动加 _1_2... 后缀
  • 中文/英文/数字/下划线之外的字符(emoji、空格、标点、hashtag 等)全部去掉