全网热点抓取与AI赛道选题筛选
Overview
从抖音、视频号、B站、AI行业社群、技术论坛等多平台聚合热搜和热门内容,通过AI/程序员赛道精准过滤和痛点识别,输出可直接用于内容创作的结构化选题清单。
When to Use
触发场景:
- 用户要求"抓取抖音/B站/视频号热搜"、"找AI赛道热点"、"程序员热门话题"
- 需要批量获取多平台热点并按AI/程序员赛道筛选
- AI自媒体/技术公众号需要突发热点选题
- 要做AI领域内容矩阵,需要持续的热点选题流
- 想看"最近大家都在讨论什么AI话题"
不适用场景:
- 已有候选选题需要策略评分 → 使用 content-topic-planner
- 需要诊断某篇具体文章的表现 → 使用 gzh-article-diagnosis
- 需要搜索微信公众号文章 → 使用 wechat-article-search
Workflow
Phase 0: 确认抓取参数
收集或推断以下信息(缺省使用默认值):
| 参数 | 说明 | 默认值 | |------|------|--------| | 目标平台 | 抖音/视频号/B站/AI社群/技术论坛 | 全部 | | 赛道 | AI/程序员/两者 | AI | | 时间范围 | 今日/本周/近7天 | 近7天 | | 输出数量 | 最终选题数量 | 10-15个 | | 内容形式 | 文章/短视频/两者 | 文章 |
Phase 1: 多平台热点聚合
对每个目标平台,使用 WebSearch 并行执行搜索。读取 references/platform_sources.md 获取每个平台的搜索关键词模板和推荐数据源。
平台搜索策略:
- 抖音热搜 — 搜索"抖音热搜 今日"、"抖音科技榜 热门",从热搜聚合站(如 tophub.today、newrank)获取数据
- 视频号 — 搜索"微信视频号 热门 AI"、"视频号 科技 爆款"
- B站 — 搜索"B站热门 科技区"、"bilibili 编程 热榜",关注技术教程、AI工具评测类内容
- AI行业社群 — 搜索"即刻 AI圈"、"小红书 AI工具"、"即刻 程序员",覆盖即刻、小红书等
- 技术论坛 — 搜索"V2EX 热门"、"GitHub trending AI"、"掘金 热门 AI"、"Hacker News AI"、"Reddit MachineLearning",覆盖 V2EX、掘金、GitHub、Hacker News、Reddit 等
执行规则:
- 每个平台的搜索并行执行
- 每条搜索返回结果取前5-8条
- 使用 WebFetch 展开疑似高价值链接获取详细内容
- 记录每条热点的:标题、来源平台、热度指标、讨论方向
→ 输出阶段产物:原始热点汇总表(所有平台聚合,约30-50条)
Phase 2: AI/程序员赛道精准过滤
从 Phase 1 汇总表中,按以下规则过滤:
正向过滤(必须命中至少1条):
- 主题涉及 AI/大模型/机器学习/深度学习/NLP/CV
- 主题涉及编程/开发工具/开源/GitHub/技术架构
- 主题涉及 AI 工具应用(如 Midjourney/Cursor/Copilot/Sora)
- 主题涉及程序员职业发展/技术趋势/薪资/招聘
- 主题涉及 AI 政策/监管/行业动态
反向过滤(命中任意1条即排除):
- 纯娱乐八卦类内容
- 与科技/AI/编程完全无关的泛生活话题
- 纯广告/营销推广内容
- 已过时效(超过30天的话题,除非是常青话题)
→ 输出阶段产物:AI/程序员赛道候选选题列表(约15-20条)
Phase 3: 痛点识别与话题提炼
对每条候选选题,读取 references/ai_pain_points.md 对照痛点分类体系,识别该话题击中哪些痛点:
核心痛点维度:
- 知识焦虑 — "我不会"、"我落后了"、"别人都会我不会"
- 效率焦虑 — "太慢了"、"能不能更快"、"有没有工具"
- 职业焦虑 — "会不会被替代"、"怎么提升竞争力"、"转行怎么做"
- 选择困难 — "这么多工具选哪个"、"哪个技术栈更好"
- 信息差/认知差 — "别人知道的我不知道"、"内部消息"
- 实操困惑 — "怎么做"、"为什么报错"、"踩坑经验"
痛点提炼规则:
- 每条选题标注主要痛点类型(1-2个)
- 提炼一句话痛点描述:受众看到后会产生"这不就是我吗"的共鸣
- 标注痛点强度:高热(普遍且紧迫)/ 中热(特定人群) / 温(慢需求)
→ 输出阶段产物:带痛点标注的强化选题列表
Phase 4: 输出结构化选题清单
综合前三阶段结果,输出最终选题清单。输出格式读取 assets/topic_template.md 模板。
每条选题包含:
### [序号] 选题标题
- **热度来源**:[平台名] × [热度指标]
- **赛道**:AI/程序员
- **痛点类型**:[标注] × [强度]
- **痛点描述**:一句话(受众共鸣点)
- **建议角度**:差异化切入点
- **时效窗口**:48小时/本周/长期
- **内容形式建议**:文章/短视频/系列
- **参考链接**:[来源URL]
排序规则:
- 痛点强度高 + 时效窗口短 → 排最前
- 多平台共振(同一话题跨平台出现)→ 排前
- 纯信息汇总型 → 排后
Phase 5: 可选后续动作
- 将选题清单传给
content-topic-planner做深度评分排序 - 将选题保存到 ima 知识库(使用 ima-skill)
- 调用
wechat-article-search查找同类爆款文章作为创作参考 - 直接根据选题清单开始创作
Core Rules
- 必须覆盖至少3个平台的数据源
- Phase 2 过滤必须严格,不允许与AI/程序员无关的话题进入候选列表
- 每条选题必须有具体的痛点类型标注,不允许标注"无痛点"
- 时效窗口必须明确,不允许"不确定"
- 优先关注"可操作性强"的选题(教程向、工具实测、趋势解读),其次是纯资讯型
- 多平台共振的选题标注"🔥多平台共振"并加权排序
- 数据源的时效性:今日热搜优先,其次本周,拒绝超过30天的数据
References
references/platform_sources.md— 各平台热搜数据源、搜索关键词模板和查询策略references/ai_pain_points.md— AI/程序员赛道痛点分类体系与案例库
Assets
assets/topic_template.md— 选题清单标准输出模板
Scripts
scripts/topic_filter.py— 从聚合热点中过滤AI/程序员相关选题的 Python 脚本scripts/pain_point_matcher.py— 将候选选题与痛点分类体系匹配的 Python 脚本
Scan to join WeChat group