短视频剧本发现专家 v1.2.3
文档版本:1.2.3 创建日期:2026-05-24 更新日期:2026-05-25 核心定位:短视频创作者和编剧的剧本发现利器
一、核心架构
1.1 技能定位
┌─────────────────────────────────────────────────────────────────────────┐
│ 短视频剧本发现专家 v1.2.3 │
├─────────────────────────────────────────────────────────────────────────┤
│ │
│ ┌───────────────────────────────────────────────────────────────────┐ │
│ │ 输入解析层 │ │
│ │ • 需求理解 (类型/题材/风格/热度) │ │
│ │ • 搜索策略选择 │ │
│ │ • 关键词提取 │ │
│ └───────────────────────────────────────────────────────────────────┘ │
│ ↓ │
│ ┌───────────────────────────────────────────────────────────────────┐ │
│ │ 搜索执行层 │ │
│ │ ┌─────────────────────────────────────────────────────────────┐ │ │
│ │ │ 内置16个搜索引擎(7个国内+9个全球) │ │ │
│ │ │ • 并行搜索 + 结果聚合 │ │ │
│ │ │ • 智能引擎选择 │ │ │
│ │ └─────────────────────────────────────────────────────────────┘ │ │
│ └───────────────────────────────────────────────────────────────────┘ │
│ ↓ │
│ ┌───────────────────────────────────────────────────────────────────┐ │
│ │ 结果处理层 │ │
│ │ • 去重 + 排序 │ │
│ │ • 可信度评估 │ │
│ │ • 结构化输出 │ │
│ └───────────────────────────────────────────────────────────────────┘ │
│ ↓ │
│ ┌───────────────────────────────────────────────────────────────────┐ │
│ │ 报告生成层 │ │
│ │ • 搜索结果汇总 │ │
│ │ • 来源标注 │ │
│ │ • 后续建议 │ │
│ └───────────────────────────────────────────────────────────────────┘ │
└─────────────────────────────────────────────────────────────────────────┘
1.2 核心能力矩阵
| 能力模块 | 功能说明 | 优先级 | |----------|----------|--------| | 多引擎搜索 | 16个搜索引擎并行/串行搜索 | ⭐⭐⭐⭐⭐ | | 类型热度分析 | 分析不同类型剧本的市场热度 | ⭐⭐⭐⭐⭐ | | 竞品研究 | 搜索同类作品进行对比 | ⭐⭐⭐⭐ | | 趋势追踪 | 追踪市场趋势和热点 | ⭐⭐⭐⭐ | | 来源追溯 | 追溯剧本/IP来源 | ⭐⭐⭐⭐⭐ | | 智能聚合 | 搜索结果去重、排序、评估 | ⭐⭐⭐⭐⭐ |
二、输入输出规范
2.1 输入契约
## 必填字段
| 字段 | 类型 | 说明 |
|------|------|------|
| search_query | string | 搜索关键词/需求描述 |
| search_type | string | 搜索类型 |
## 可选字段
| 字段 | 类型 | 默认值 | 说明 |
|------|------|--------|------|
| genre | string | null | 剧本类型 |
| style | string | null | 风格偏好 |
| region | string | "all" | 搜索区域: cn/global/all |
| count | number | 10 | 返回结果数量 |
| engines | string[] | null | 指定引擎 |
2.2 搜索类型
| 类型标识 | 说明 | 触发场景 | |----------|------|----------| | SCREENPLAY_NAME | 按名称搜索剧本 | 已知剧名 | | SCREENPLAY_TYPE | 按类型搜索剧本 | 找某类型剧本 | | SCREENPLAY_TOPIC | 按题材搜索剧本 | 找某题材剧本 | | SCREENPLAY_TRENDING | 搜索热门剧本 | 找当下热门 | | SCREENPLAY_SIMILAR | 搜索相似剧本 | 找类似已有剧本 | | SCREENPLAY_SOURCE | 追溯IP来源 | 找小说/漫画改编 | | SCREENPLAY_HOTTEST | 搜索爆款剧本 | 找最热门作品 | | COMPETITOR_RESEARCH | 竞品研究 | 市场分析用 |
2.3 输出契约
{
"status": "success",
"data": {
"search_type": "SCREENPLAY_TYPE",
"query": "复仇 大女主 剧",
"results": [
{
"title": "剧本标题",
"type": "类型",
"source": "来源平台",
"url": "链接",
"snippet": "简介",
"heat_level": "热度",
"relevance_score": 0.95,
"engine": "搜索引擎"
}
],
"summary": {
"total_results": 50,
"engines_used": ["百度", "Google"],
"search_time": "2026-05-24T12:00:00Z"
}
}
}
三、16个搜索引擎集成
3.1 国内搜索引擎 (7个)
| 引擎 | URL | 用途 | 优先级 | |------|-----|------|--------| | 百度 | https://www.baidu.com/s?wd={keyword} | 综合搜索 | 1 | | 必应中国 | https://cn.bing.com/search?q={keyword} | 综合搜索 | 2 | | 360搜索 | https://www.so.com/s?q={keyword} | 综合搜索 | 3 | | 搜狗搜索 | https://sogou.com/web?query={keyword} | 综合搜索 | 4 | | 微信搜索 | https://wx.sogou.com/weixin?type=2&query={keyword} | 社交内容 | 5 | | 神马搜索 | https://m.sm.cn/s?q={keyword} | 移动搜索 | 6 | | 豆瓣 | https://www.douban.com/search?q={keyword} | 影视评价 | 7 |
3.2 国际搜索引擎 (9个)
| 引擎 | URL | 用途 | 优先级 | |------|-----|------|--------| | Google | https://www.google.com/search?q={keyword} | 全球搜索 | 1 | | Google香港 | https://www.google.hk/search?q={keyword} | 华语搜索 | 2 | | DuckDuckGo | https://duckduckgo.com/html/?q={keyword} | 隐私搜索 | 3 | | Yahoo | https://search.yahoo.com/search?p={keyword} | 综合搜索 | 4 | | Startpage | https://www.startpage.com/sp/search?query={keyword} | 隐私搜索 | 5 | | Brave | https://search.brave.com/search?q={keyword} | 独立索引 | 6 | | Ecosia | https://www.ecosia.org/search?q={keyword} | 环保搜索 | 7 | | Qwant | https://www.qwant.com/?q={keyword} | 欧洲搜索 | 8 | | IMDB | https://www.imdb.com/find?q={keyword} | 影视数据库 | 9 |
3.3 引擎选择策略
## 自动引擎选择规则
IF query_language == "中文" THEN
USE [百度, 必应中国, 搜狗, 微信搜索, 豆瓣] // 优先国内
ADD [Google, Google香港] if insufficient results
ELSE IF query_language == "英文" THEN
USE [Google, DuckDuckGo, Yahoo, IMDB]
ADD [百度] if need Chinese results
ELSE
USE [Google, DuckDuckGo] // 默认国际
END
## 专业场景引擎选择
| 场景 | 推荐引擎 |
|------|----------|
| 找中文剧本 | 百度, 搜狗, 微信, 豆瓣 |
| 找海外剧本 | Google, IMDB, Yahoo |
| 找热门剧本 | 微博热搜, 百度指数, Google趋势 |
| 找冷门剧本 | 豆瓣, IMDB, 特定论坛 |
| 找小说改编 | 起点, 晋江, 纵横, Google |
四、搜索策略
4.1 按名称搜索 (SCREENPLAY_NAME)
## 搜索流程
1. 构建搜索词
- 原始剧名
- 原始剧名 + "剧本"
- 原始剧名 + "小说"
- 原始剧名 + "原著"
2. 执行搜索
- 国内引擎搜索剧名
- 国际引擎搜索英文名
3. 结果处理
- 提取剧本信息
- 标注来源平台
- 评估完整度
## 示例
输入: "《赘婿》"
搜索词:
- "赘婿 剧本"
- "赘婿 原著小说"
- "赘婿 电视剧"
4.2 按类型搜索 (SCREENPLAY_TYPE)
## 搜索流程
1. 类型关键词扩展
- 主类型: "复仇剧", "甜宠剧", "悬疑剧"
- 子类型: "大女主", "穿越", "玄幻"
2. 热门类型搜索
- 类型 + "热门剧本"
- 类型 + "爆款剧本"
- 类型 + "2026"
3. 聚合与排序
- 按热度排序
- 按时间排序
- 按相关性排序
## 类型关键词库
| 类型 | 中文关键词 | 英文关键词 |
|------|-----------|-----------|
| 复仇 | 复仇,大女主,爽剧 | revenge, hit girl |
| 甜宠 | 甜宠,恋爱,撒糖 | romance, sweet |
| 悬疑 | 悬疑,推理,烧脑 | mystery, thriller |
| 穿越 | 穿越,时空 | time travel, transmigration |
| 职场 | 职场,都市,独立 | workplace, career |
| 豪门 | 豪门,总裁,霸道 | CEO, rich, romance |
4.3 按题材搜索 (SCREENPLAY_TOPIC)
## 搜索流程
1. 题材理解
- 提取核心题材元素
- 扩展同义词
2. 多维度搜索
- 题材 + "剧本"
- 题材 + "小说改编"
- 题材 + "短剧"
3. 来源追溯
- 小说平台搜索
- 漫画平台搜索
- 原创剧本平台
## 题材分类
| 题材大类 | 细分题材 |
|----------|----------|
| 都市情感 | 婚姻,职场,家庭,友情 |
| 古装历史 | 宫斗,宅斗,历史,神话 |
| 青春校园 | 校园,成长,暗恋,创业 |
| 科幻未来 | 星际,赛博,AI,末日 |
| 犯罪推理 | 刑侦,推理,卧底,黑帮 |
4.4 热门搜索 (SCREENPLAY_TRENDING)
## 搜索流程
1. 热度数据获取
- 百度指数
- Google趋势
- 微博热搜
- 抖音热榜
2. 热门剧本聚合
- 热搜关键词 + "剧本"
- 热播剧 + "剧本"
- 热门小说 + "改编"
3. 趋势分析
- 近7天热度
- 近30天趋势
- 预测下周热点
## 热门数据源
| 平台 | 数据类型 | 用途 |
|------|----------|------|
| 微博热搜 | 实时热点 | 追热点 |
| 百度指数 | 搜索热度 | 趋势分析 |
| Google趋势 | 全球趋势 | 国际热点 |
| 抖音热榜 | 短视频热点 | 新兴热点 |
| 豆瓣评分 | 评价热度 | 口碑分析 |
4.5 相似剧本搜索 (SCREENPLAY_SIMILAR)
## 搜索流程
1. 特征提取
- 从已知剧本提取类型
- 从已知剧本提取题材
- 从已知剧本提取风格
2. 相似度搜索
- 类型相同 + 题材相似
- 同作者/同平台
- 同导演/同演员
3. 推荐排序
- 相似度评分
- 热度加权
- 评分加权
## 示例
输入: "喜欢《赘婿》,找类似"
特征: 古装, 穿越, 喜剧, 爽剧
搜索: "古装 穿越 喜剧 爽剧 剧本"
4.6 IP来源追溯 (SCREENPLAY_SOURCE)
## 搜索流程
1. 识别IP类型
- 小说改编
- 漫画改编
- 游戏改编
- 原创剧本
2. 原著平台搜索
- 起点中文网
- 晋江文学城
- 纵横中文网
- 快看漫画
3. 版权信息
- 改编版权归属
- 制作公司
- 演员阵容
## IP来源识别
| 特征 | IP来源 |
|------|--------|
| "改编自" | 小说/漫画 |
| "原创剧本" | 原创 |
| "游戏改编" | 游戏 |
| "同名小说" | 小说 |
五、搜索执行流程
5.1 完整工作流
┌─────────────────────────────────────────────────────────────────────────┐
│ Step 1: 需求解析 │
│ │
│ • 理解用户搜索意图 │
│ • 提取关键搜索词 │
│ • 确定搜索类型 │
│ • 选择目标引擎 │
└─────────────────────────────────────────────────────────────────────────┘
↓
┌─────────────────────────────────────────────────────────────────────────┐
│ Step 2: 搜索执行 │
│ │
│ • 构建搜索URL │
│ • 执行并行搜索 (最多5个引擎同时) │
│ • 收集搜索结果 │
│ • 处理反爬虫/验证码 │
└─────────────────────────────────────────────────────────────────────────┘
↓
┌─────────────────────────────────────────────────────────────────────────┐
│ Step 3: 结果处理 │
│ │
│ • 去除重复结果 │
│ • 按相关性排序 │
│ • 提取关键信息 │
│ • 评估可信度 │
└─────────────────────────────────────────────────────────────────────────┘
↓
┌─────────────────────────────────────────────────────────────────────────┐
│ Step 4: 报告生成 │
│ │
│ • 汇总搜索结果 │
│ • 标注来源和引擎 │
│ • 提供后续建议 │
│ • 输出结构化报告 │
└─────────────────────────────────────────────────────────────────────────┘
5.2 并行搜索策略
## 并行搜索配置
• 同时搜索引擎数: 最多5个
• 请求间隔: 1-2秒
• 超时时间: 30秒/引擎
• 重试次数: 1次
## 搜索批次
Batch 1: [百度, Google, 搜狗, DuckDuckGo, 豆瓣]
↓ 间隔2秒
Batch 2: [必应中国, Yahoo, IMDB, 微信搜索, 神马]
↓ 间隔2秒
Batch 3: [360, Startpage, Brave, Ecosia, Qwant]
5.3 结果去重与排序
## 去重规则
• URL完全相同 → 去除重复
• 标题完全相同 → 保留最高相关性
• 内容高度相似(>80%) → 合并
## 排序规则
Score = relevance × 0.4 + heat × 0.3 + recency × 0.2 + authority × 0.1
• relevance: 与搜索词的相关性
• heat: 热度/点击量
• recency: 时效性 (新内容优先)
• authority: 来源平台权威性
六、输出报告模板
6.1 搜索结果报告
# 剧本搜索结果报告
## 搜索概要
- **搜索类型**: SCREENPLAY_TYPE
- **搜索词**: 复仇 大女主 爽剧
- **搜索时间**: 2026-05-24 12:00:00
- **使用引擎**: 百度, Google, 豆瓣, 微信搜索
- **结果数量**: 50条
---
## 搜索结果
### 1. 《重生之复仇女王》 [相似度: 95%]
- **类型**: 复仇大女主
- **来源**: 某平台
- **热度**: 🔥🔥🔥🔥🔥
- **链接**: https://example.com/screenplay1
- **简介**: 女主前世被陷害,重生后展开复仇...
- **引擎来源**: 百度
### 2. 《致命宠溺》 [相似度: 88%]
- **类型**: 豪门+复仇
- **来源**: 某平台
- **热度**: 🔥🔥🔥🔥
- **链接**: https://example.com/screenplay2
- **简介**: 落难千金逆袭豪门...
- **引擎来源**: Google
---
## 热门类型分析
| 类型 | 热度指数 | 趋势 |
|------|----------|------|
| 复仇大女主 | 95/100 | ↗ 上升 |
| 甜宠剧 | 85/100 | → 平稳 |
| 悬疑剧 | 80/100 | ↗ 上升 |
---
## 💡 市场洞察与趋势分析
### 市场机会分析
- **高热度类型**: 复仇大女主、悬疑剧处于上升趋势,适合跟风创作
- **竞争强度**: 复仇类型头部效应明显,建议差异化定位
- **题材空白**: 复仇+职场复合类型搜索量低但有增长潜力
### 趋势预测
- **短期趋势**: 复仇爽剧持续火爆,预计热度延续至Q3
- **新兴题材**: 重生+复仇+甜宠融合型剧本开始冒头
- **风险提示**: 同质化严重,建议在叙事结构上创新
### 创作建议
1. 复仇类型市场热度高,但需在人物设定上差异化
2. 建议融合职场或家庭元素增加厚度
3. 避免与头部作品直接竞争,可瞄准细分人群
---
## 后续建议
1. 建议关注复仇类型,市场热度高
2. 可以考虑《重生之复仇女王》的叙事结构
3. 避免与头部作品直接竞争
6.2 增值输出说明
| 增值模块 | 说明 | 价值 | |----------|------|------| | 市场洞察 | 基于搜索结果的行业分析 | 辅助创作决策 | | 趋势预测 | 热度趋势和周期预测 | 把握市场时机 | | 竞争分析 | 头部作品和差异化机会 | 找准定位 | | 创作建议 | 基于数据的实操建议 | 直接指导创作 |
6.3 输出质量标准
| 质量维度 | 标准 | 说明 | |----------|------|------| | 准确性 | ≥90% | 搜索结果与关键词相关性 | | 完整性 | 8项+ | 包含摘要/来源/热度/评分 | | 时效性 | ≤24h | 数据更新周期 | | 可操作性 | 3条+ | 提供具体创作建议 |
七、错误处理
7.1 错误类型
| 错误类型 | 处理策略 | |---------|---------| | 搜索服务不可用 | 切换到备用引擎 | | 请求超时 | 重试1次,失败则跳过 | | 反爬虫拦截 | 更换引擎,降低频率 | | 无搜索结果 | 扩展关键词,推荐相关 | | 结果质量过低 | 调整相关性阈值 |
7.2 Fallback机制
## 降级策略
Primary Engine Failed →
Try Backup Engine →
Try General Search →
Use Cached Results →
Return "无结果" + 建议
## 缓存策略
• 最近搜索结果缓存: 1小时
• 热门剧本数据缓存: 24小时
• 类型热度数据缓存: 12小时
八、能力边界定义
8.1 明确能力范围
## ✅ 能做什么
| 能力 | 说明 |
|------|------|
| 剧本搜索 | 按名称、类型、题材搜索剧本 |
| 多引擎搜索 | 16个搜索引擎并行/串行搜索 |
| 结果聚合 | 去重、排序、相关性评估 |
| IP追溯 | 追溯小说/漫画改编来源 |
| 市场分析 | 竞品研究、趋势追踪 |
| 报告生成 | 结构化搜索报告输出 |
## ❌ 不能做什么
| 限制 | 说明 |
|------|------|
| 实时监控 | 不支持持续监控,数据为搜索时点快照 |
| 深度分析 | 不提供剧本内容深度分析 |
| 批量搜索 | 建议间隔10秒以上,避免限流 |
| 非中文优化 | 国际引擎对中文支持有限 |
8.2 适用行业与场景
| 行业 | 适用场景 | 推荐搜索类型 | |------|----------|--------------| | 影视制作公司 | 剧本采购、项目立项 | SCREENPLAY_TYPE, COMPETITOR_RESEARCH | | IP改编 | 小说/漫画影视化 | SCREENPLAY_SOURCE, SCREENPLAY_SIMILAR | | 内容平台 | 热门内容推荐 | SCREENPLAY_TRENDING, SCREENPLAY_HOTTEST | | 剧本创作 | 灵感收集、市场调研 | SCREENPLAY_TYPE, SCREENPLAY_SIMILAR | | 投资机构 | 市场分析、趋势预测 | COMPETITOR_RESEARCH, SCREENPLAY_TRENDING | | 教育培训 | 案例分析、教学素材 | SCREENPLAY_NAME, SCREENPLAY_SOURCE |
8.3 用户画像
| 用户类型 | 需求特征 | 核心功能 | |----------|----------|----------| | 编剧 | 找灵感、调研市场 | 类型搜索、相似搜索 | | 制片人 | 采购剧本、分析竞品 | 竞品研究、趋势追踪 | | IP运营 | 追溯来源、分析潜力 | IP来源追溯、热度分析 | | 学生 | 学习案例、了解行业 | 名称搜索、来源追溯 |
8.4 不适用场景
- 需要实时数据的监控场景 → 建议使用微博热搜API等
- 需要剧本内容深度分析 → 建议使用剧本审查分析Skill
- 短时间内大量搜索 → 建议分批执行,间隔10秒
九、安全自检清单
9.1 安全检测自检
## 安全自检清单
### T-TRUST-1: 供应链安全 ✅
- [ ] 仅使用 PyPI 官方源
- [ ] 依赖版本固定在 requirements.txt
- [ ] 无未知来源的 pip install
### T-TRUST-2: 命令执行安全 ✅
- [ ] 避免 os.system() / subprocess shell=True
- [ ] 命令参数使用列表传参而非字符串
- [ ] 无危险的系统命令
### T-TRUST-3: 网络请求安全 ✅
- [ ] HTTP请求仅用于搜索引擎调用
- [ ] 不收集或上传用户数据
- [ ] 使用HTTPS
### T-TRUST-4: 文件操作安全 ✅
- [ ] 文件操作限制在技能目录内
- [ ] 禁止 ../ 路径遍历
### T-TRUST-5: Prompt注入防护 ✅
- [ ] 用户输入经过基本校验
- [ ] 输入长度限制在合理范围
### T-TRUST-6: 远程代码防护 ✅
- [ ] 不从远程URL下载代码执行
- [ ] 不使用 exec()/eval() 执行动态代码
十、错误处理规范
10.1 错误类型与处理
## 错误处理矩阵
| 错误类型 | 处理策略 | 用户提示 |
|----------|----------|----------|
| 引擎失败 | 切换备用引擎 | "部分引擎不可用,已切换" |
| 请求超时 | 重试1次,降低频率 | "请求超时,正在重试" |
| 无搜索结果 | 扩展关键词 | "未找到结果,建议扩展关键词" |
| 反爬虫拦截 | 降低请求频率 | "请求过于频繁,请稍后重试" |
| 网络错误 | 等待后重试 | "网络错误,请检查网络连接" |
10.2 Fallback机制
## Fallback降级策略
Primary Engine Failed →
Try Backup Engine →
Try General Search →
Use Cached Results →
Return "无结果" + 建议
## 缓存策略
| 数据类型 | 缓存时间 |
|----------|----------|
| 最近搜索结果 | 1小时 |
| 热门剧本数据 | 24小时 |
| 类型热度数据 | 12小时 |
十一、相关资源
| 文档 | 说明 | |------|------| | references/搜索策略.md | 详细搜索策略 | | references/剧本来源.md | 剧本来源平台汇总 | | references/类型热度分析.md | 类型热度分析指南 | | references/搜索协议.md | 8种搜索协议定义 | | examples/示例剧本_都市创业剧.txt | 标准剧本格式参考 | | FAQ.md | 常见问题解答 |
十二、快速开始
12.1 5分钟入门
# 1. 安装依赖
pip install -r requirements.txt
# 2. 执行搜索
python3 tools/搜索引擎/search.py --query "复仇大女主剧" --engines Baidu,Google --count 10
# 3. 查看结果
cat search_results.json
12.2 典型使用示例
按类型搜索复仇剧本:
python3 tools/搜索引擎/search.py \
--query "复仇 大女主 爽剧" \
--search-type SCREENPLAY_TYPE \
--engines Baidu,Douban,WeChat \
--count 15
竞品研究:
python3 tools/搜索引擎/search.py \
--query "复仇剧 市场分析 2026" \
--search-type COMPETITOR_RESEARCH \
--region cn \
--count 20
12.3 最佳实践
- 先广后窄 - 先用通用词搜索,再缩小范围
- 多引擎组合 - 国内+国际引擎组合使用效果更好
- 善用类型标签 - 使用 genre_keywords 中的标签组合
- 查看来源平台 - 优先选择权威平台结果
- 避免限流 - 间隔5秒以上再搜索
十三、TRACE 自验证清单
13.1 发布前自检
## TRACE 自验证
### T - Trust
- [ ] 安全性检查通过(无P0/P1安全问题)
- [ ] 国内网络环境可用(无VPN依赖)
- [ ] 中文交互完整支持
### R - Reliability
- [ ] 重试机制存在(retry: 1-3次)
- [ ] 超时处理完善(timeout: 10-30秒)
- [ ] 错误提示友好
### A - Adaptability
- [ ] 能力边界清晰
- [ ] 触发条件明确
- [ ] 示例无歧义
### C - Convention
- [ ] 文档结构分层(核心→详细→参考)
- [ ] 输入输出有样例
- [ ] FAQ 完备
### E - Effectiveness
- [ ] 输出准确可靠
- [ ] 内容完整
- [ ] 开箱即用
13.2 评分自检
| 维度 | 目标分 | 自检要点 | |------|--------|----------| | T - Trust | 4.8-5.0 | 安全检测通过+国内适配 | | R - Reliability | 4.5-5.0 | 重试/超时/错误处理完善 | | A - Adaptability | 4.2-4.8 | 能力边界清晰+触发明确 | | C - Convention | 4.2-4.8 | 分层披露+结构规范+FAQ完备 | | E - Effectiveness | 4.5-5.0 | 准确+完整+开箱即用+增值 |
文档版本:1.2.3 创建日期:2026-05-24 更新日期:2026-05-25 核心能力:16引擎搜索、多类型支持、智能聚合、搜索报告生成 本次更新:增强市场洞察与趋势分析、新增行业场景和用户画像、新增典型失败案例
微信扫一扫