Back to skills
extension
Category: Data & AnalyticsNo API key required

全网热点抓取

全网热点抓取与AI/程序员赛道选题筛选。当用户需要抓取抖音、视频号、B站、AI行业社群、技术论坛等平台的热搜/热门内容,并从中筛选AI/程序员赛道高热度痛点话题、生成选题清单时触发。核心功能:多平台热点聚合 → AI/程序员赛道精准过滤 → 痛点识别 → 结构化选题清单输出。与 content-topic-planner 的区别在于:本 Skill 聚焦于跨平台原始热点数据采集与AI赛道过滤,content-topic-planner 聚焦于选题策略策划与评分体系。两者可串联使用:先用本 Skill 采集候选选题列表,再用 content-topic-planner 进行策略化评分排序。

personAuthor: user_7ba6d872hubcommunity

全网热点抓取与AI赛道选题筛选

Overview

从抖音、视频号、B站、AI行业社群、技术论坛等多平台聚合热搜和热门内容,通过AI/程序员赛道精准过滤和痛点识别,输出可直接用于内容创作的结构化选题清单。

When to Use

触发场景:

  • 用户要求"抓取抖音/B站/视频号热搜"、"找AI赛道热点"、"程序员热门话题"
  • 需要批量获取多平台热点并按AI/程序员赛道筛选
  • AI自媒体/技术公众号需要突发热点选题
  • 要做AI领域内容矩阵,需要持续的热点选题流
  • 想看"最近大家都在讨论什么AI话题"

不适用场景:

  • 已有候选选题需要策略评分 → 使用 content-topic-planner
  • 需要诊断某篇具体文章的表现 → 使用 gzh-article-diagnosis
  • 需要搜索微信公众号文章 → 使用 wechat-article-search

Workflow

Phase 0: 确认抓取参数

收集或推断以下信息(缺省使用默认值):

| 参数 | 说明 | 默认值 | |------|------|--------| | 目标平台 | 抖音/视频号/B站/AI社群/技术论坛 | 全部 | | 赛道 | AI/程序员/两者 | AI | | 时间范围 | 今日/本周/近7天 | 近7天 | | 输出数量 | 最终选题数量 | 10-15个 | | 内容形式 | 文章/短视频/两者 | 文章 |

Phase 1: 多平台热点聚合

对每个目标平台,使用 WebSearch 并行执行搜索。读取 references/platform_sources.md 获取每个平台的搜索关键词模板和推荐数据源。

平台搜索策略:

  1. 抖音热搜 — 搜索"抖音热搜 今日"、"抖音科技榜 热门",从热搜聚合站(如 tophub.today、newrank)获取数据
  2. 视频号 — 搜索"微信视频号 热门 AI"、"视频号 科技 爆款"
  3. B站 — 搜索"B站热门 科技区"、"bilibili 编程 热榜",关注技术教程、AI工具评测类内容
  4. AI行业社群 — 搜索"即刻 AI圈"、"小红书 AI工具"、"即刻 程序员",覆盖即刻、小红书等
  5. 技术论坛 — 搜索"V2EX 热门"、"GitHub trending AI"、"掘金 热门 AI"、"Hacker News AI"、"Reddit MachineLearning",覆盖 V2EX、掘金、GitHub、Hacker News、Reddit 等

执行规则:

  • 每个平台的搜索并行执行
  • 每条搜索返回结果取前5-8条
  • 使用 WebFetch 展开疑似高价值链接获取详细内容
  • 记录每条热点的:标题、来源平台、热度指标、讨论方向

→ 输出阶段产物:原始热点汇总表(所有平台聚合,约30-50条)

Phase 2: AI/程序员赛道精准过滤

从 Phase 1 汇总表中,按以下规则过滤:

正向过滤(必须命中至少1条):

  • 主题涉及 AI/大模型/机器学习/深度学习/NLP/CV
  • 主题涉及编程/开发工具/开源/GitHub/技术架构
  • 主题涉及 AI 工具应用(如 Midjourney/Cursor/Copilot/Sora)
  • 主题涉及程序员职业发展/技术趋势/薪资/招聘
  • 主题涉及 AI 政策/监管/行业动态

反向过滤(命中任意1条即排除):

  • 纯娱乐八卦类内容
  • 与科技/AI/编程完全无关的泛生活话题
  • 纯广告/营销推广内容
  • 已过时效(超过30天的话题,除非是常青话题)

→ 输出阶段产物:AI/程序员赛道候选选题列表(约15-20条)

Phase 3: 痛点识别与话题提炼

对每条候选选题,读取 references/ai_pain_points.md 对照痛点分类体系,识别该话题击中哪些痛点:

核心痛点维度:

  1. 知识焦虑 — "我不会"、"我落后了"、"别人都会我不会"
  2. 效率焦虑 — "太慢了"、"能不能更快"、"有没有工具"
  3. 职业焦虑 — "会不会被替代"、"怎么提升竞争力"、"转行怎么做"
  4. 选择困难 — "这么多工具选哪个"、"哪个技术栈更好"
  5. 信息差/认知差 — "别人知道的我不知道"、"内部消息"
  6. 实操困惑 — "怎么做"、"为什么报错"、"踩坑经验"

痛点提炼规则:

  • 每条选题标注主要痛点类型(1-2个)
  • 提炼一句话痛点描述:受众看到后会产生"这不就是我吗"的共鸣
  • 标注痛点强度:高热(普遍且紧迫)/ 中热(特定人群) / 温(慢需求)

→ 输出阶段产物:带痛点标注的强化选题列表

Phase 4: 输出结构化选题清单

综合前三阶段结果,输出最终选题清单。输出格式读取 assets/topic_template.md 模板。

每条选题包含:

### [序号] 选题标题
- **热度来源**:[平台名] × [热度指标]
- **赛道**:AI/程序员
- **痛点类型**:[标注] × [强度]
- **痛点描述**:一句话(受众共鸣点)
- **建议角度**:差异化切入点
- **时效窗口**:48小时/本周/长期
- **内容形式建议**:文章/短视频/系列
- **参考链接**:[来源URL]

排序规则:

  • 痛点强度高 + 时效窗口短 → 排最前
  • 多平台共振(同一话题跨平台出现)→ 排前
  • 纯信息汇总型 → 排后

Phase 5: 可选后续动作

  • 将选题清单传给 content-topic-planner 做深度评分排序
  • 将选题保存到 ima 知识库(使用 ima-skill)
  • 调用 wechat-article-search 查找同类爆款文章作为创作参考
  • 直接根据选题清单开始创作

Core Rules

  • 必须覆盖至少3个平台的数据源
  • Phase 2 过滤必须严格,不允许与AI/程序员无关的话题进入候选列表
  • 每条选题必须有具体的痛点类型标注,不允许标注"无痛点"
  • 时效窗口必须明确,不允许"不确定"
  • 优先关注"可操作性强"的选题(教程向、工具实测、趋势解读),其次是纯资讯型
  • 多平台共振的选题标注"🔥多平台共振"并加权排序
  • 数据源的时效性:今日热搜优先,其次本周,拒绝超过30天的数据

References

  • references/platform_sources.md — 各平台热搜数据源、搜索关键词模板和查询策略
  • references/ai_pain_points.md — AI/程序员赛道痛点分类体系与案例库

Assets

  • assets/topic_template.md — 选题清单标准输出模板

Scripts

  • scripts/topic_filter.py — 从聚合热点中过滤AI/程序员相关选题的 Python 脚本
  • scripts/pain_point_matcher.py — 将候选选题与痛点分类体系匹配的 Python 脚本