AI Frontier Pulse — AI 前沿脉搏
追踪 AI 领域最具影响力的人物和机构的最新发言、文章与观点,自动生成结构化中文摘要。
核心能力
- KOL 发言追踪 — 监控 AI 大佬在 Twitter/X 的重要发言
- 前沿文章采集 — 追踪 VC 博客、Substack、个人博客的深度 AI 文章
- 社区热议捕捉 — Reddit、Hacker News 上的 AI 热门讨论
- 论文/开源追踪 — arXiv 热门论文、GitHub Trending AI 项目
- 智能筛选输出 — LLM 过滤噪音,只保留真正有前沿价值的内容
双模式数据获取
Skill 支持两种 Twitter/X 数据获取模式,自动检测切换:
🅰 AISA API 模式(精准模式)
当环境变量 AISA_API_KEY 已配置时自动启用。
- 通过 AISA API(api.aisa.one)直接读取指定 KOL 的 Twitter 时间线
- 精准、实时、带原文链接
- 费用:约 $0.0004/次调用(每日运行约几毛钱人民币)
- 获取方式:访问 https://aisa.one 注册获取 API Key
获取 KOL 最新推文时,执行 scripts/fetch_twitter_aisa.py:
python3 scripts/fetch_twitter_aisa.py --usernames "karpathy,sama,ylecun" --limit 10
脚本返回 JSON 格式的推文列表,包含原文、时间、链接。
🅱 WebSearch 模式(免费模式)
当 AISA_API_KEY 未配置时自动降级到此模式。
- 通过 Agent 的 web_search 工具间接搜索 Twitter 内容
- 零成本、零配置
- 覆盖率约 60-70%,时效性有延迟
使用精准搜索语法提高命中率:
"from:karpathy" site:x.com OR site:twitter.com AI 2026
"from:sama" site:x.com new model OR release OR announcement
KOL 名单
完整的默认追踪名单见 references/kol_list.md。名单按影响力分层:
🔴 T0 — 行业领袖(每日必查)
- Andrej Karpathy (@karpathy) — 前 OpenAI/Tesla AI 总监,个人知识库等开创性理念提出者
- Sam Altman (@sama) — OpenAI CEO
- Demis Hassabis (@demaboratory) — Google DeepMind CEO,诺贝尔奖得主
- Ilya Sutskever (@iaborovikov) — SSI 创始人,前 OpenAI 首席科学家
- Dario Amodei (@DarioAmodei) — Anthropic CEO
- Jensen Huang — NVIDIA CEO
🟠 T1 — 技术先驱(每日查)
- Yann LeCun (@ylecun) — Meta 首席 AI 科学家,图灵奖得主
- Jim Fan (@DrJimFan) — NVIDIA 高级研究科学家,具身智能先锋
- Andrej Karpathy 的个人博客 (karpathy.github.io)
- François Chollet (@fchollet) — Keras 创建者,ARC 基准提出者
- George Hotz (@realGeorgeHotz) — comma.ai/tinygrad 创始人
🟡 T2 — 深度观点(2-3天查一次)
- Jack Clark (@jackclarkSF) — Anthropic 联创,Import AI Newsletter
- Eliezer Yudkowsky (@ESYudkowsky) — AI 安全领域思想领袖
- Emad Mostaque — Stability AI 前 CEO
- Harrison Chase (@hwchase17) — LangChain 创始人
完整名单含 VC 机构和媒体源,见 references/kol_list.md。
执行流程
当触发 AI 前沿简报采集时,按以下流程执行:
Step 1:确定模式和时间范围
import os
mode = "aisa" if os.environ.get("AISA_API_KEY") else "websearch"
# 默认查最近 24 小时,可自定义
Step 2:采集 Twitter/X KOL 发言
AISA 模式:
运行 scripts/fetch_twitter_aisa.py,自动遍历 T0+T1 名单获取最新推文。
WebSearch 模式: 依次执行以下搜索(一次最多搜索 3-5 个 KOL,避免信息过载):
# T0 KOL 搜索
"karpathy" (AI OR model OR training OR agent) site:x.com {当前月份} {当前年份}
"Sam Altman" (GPT OR OpenAI OR release OR model) site:x.com {当前月份} {当前年份}
"Demis Hassabis" (Gemini OR DeepMind OR AI) site:x.com {当前月份} {当前年份}
# T1 KOL 搜索
"Yann LeCun" (AI OR AGI OR LLM) site:x.com {当前月份} {当前年份}
"Jim Fan" (embodied OR agent OR NVIDIA) site:x.com {当前月份} {当前年份}
"George Hotz" (tinygrad OR AI OR model) site:x.com {当前月份} {当前年份}
Step 3:采集前沿文章与深度内容
搜索以下来源(使用 web_search 工具):
# VC 博客 & 深度分析
site:sequoiacap.com AI {当前月份} {当前年份}
site:a16z.com AI agent OR model OR infrastructure {当前年份}
site:greylock.com AI {当前年份}
# Substack & Newsletter 知名作者
site:substack.com (AI OR LLM OR agent) trending {当前月份} {当前年份}
"Import AI" newsletter Jack Clark {当前月份} {当前年份}
"One Useful Thing" Ethan Mollick AI {当前月份} {当前年份}
"The Batch" Andrew Ng deeplearning.ai {当前月份} {当前年份}
# 个人博客 & 长文
site:karpathy.github.io {当前年份}
site:lmsys.org {当前月份} {当前年份}
site:lilianweng.github.io {当前年份}
"Simon Willison" AI {当前月份} {当前年份}
Step 4:采集社区热议
# Reddit AI 社区
site:reddit.com/r/MachineLearning hot {当前月份} {当前年份}
site:reddit.com/r/LocalLLaMA best {当前月份} {当前年份}
site:reddit.com/r/ClaudeAI OR /r/ChatGPT breakthrough {当前月份} {当前年份}
# Hacker News
site:news.ycombinator.com AI (show OR launch OR paper) {当前月份} {当前年份}
Step 5:采集论文 & 开源
# arXiv 热门论文
site:arxiv.org AI (transformer OR agent OR reasoning) {当前月份} {当前年份}
site:huggingface.co (new model OR release OR trending) {当前月份} {当前年份}
# GitHub Trending
github trending AI machine-learning {当前周}
Step 6:智能筛选与输出
用 LLM 对采集到的全部内容进行筛选和总结,过滤标准:
- ✅ 保留:新模型发布/重大更新、引领新方向的观点(如 Karpathy 的个人知识库)、重要技术突破、行业重大合作/收购、有深度洞见的长文
- ❌ 过滤:日常闲聊、营销推广、重复信息、纯转发无评论
输出格式
格式规范要求
- 来源与时间合并显示:不要使用 "⏰ 最早出现:" 或 "🔗 来源:" 等标签前缀,而是将来源信息和时间直接合并在简洁的行中。
- 来源行格式:
⦁来源:{来源名称1} | {来源名称2} | {YYYY年M月D日},多个来源用|分隔,时间放在末尾。 - 链接行格式:
⦁🔗 [{来源1名称}]({URL1}) | [{来源2名称}]({URL2}),多个链接用|分隔,放在同一行。 - 时间取最早:采集时对比各来源的发布时间,取最早的那个标注。
按以下格式输出中文结构化简报:
# 🧠 AI 前沿脉搏 — {日期}
## 🔥 今日头条(最重要的 1-3 条)
### 1. {标题}
⦁来源:{主要来源名称} | {YYYY年M月D日}
⦁摘要:{2-3 句中文摘要}
⦁为什么重要:{一句话说明前沿价值}
⦁🔗 [{来源1名称}]({URL1}) | [{来源2名称}]({URL2}) | [{来源3名称}]({URL3})
---
## 💡 KOL 重要发言
### {KOL 名字}(@{handle})
⦁来源:{平台名} | {YYYY年M月D日}
> "{原文摘录或翻译}"
⦁解读:{简要解读}
⦁🔗 [{平台名}]({原文URL}) | [{转载/报道平台}]({URL})
(按 T0 → T1 → T2 优先级排列)
---
## 📰 前沿文章 & 深度分析
### {文章标题}
⦁来源:{作者} | {机构/平台} | {YYYY年M月D日}
⦁核心观点:{3-5 个要点}
⦁🔗 [{原始发布平台}]({URL}) | [{其他引用/讨论}]({URL})
---
## 🔬 论文 & 开源
### {论文/项目名}
⦁来源:{arXiv/GitHub/HuggingFace} | {YYYY年M月D日}
⦁简介:{一句话说明}
⦁🔗 [{来源1}]({URL}) | [{相关讨论/报道}]({URL})
---
## 🗣️ 社区热议
### {话题}
⦁来源:{Reddit/HN 子版块} | {YYYY年M月D日}
⦁讨论焦点:{核心观点}
⦁🔗 [{社区讨论帖}]({URL}) | [{相关原始来源}]({URL})
---
> 📊 本期共采集 {N} 条信息,筛选后保留 {M} 条
> 🔄 数据模式:{AISA API 精准模式 / WebSearch 免费模式}
多源交叉比对说明
在采集过程中,同一事件可能出现在多个来源(如某论文同时在 arXiv、Twitter、Reddit、HN 上被讨论)。输出时应:
- 将所有发现该消息的来源链接全部用
|分隔放在同一行的 🔗 行中 - 对比各来源的发布时间,取最早的标注在来源行末尾
- 如果不同来源的信息有补充或差异,在摘要中综合呈现
自定义配置
用户可通过对话随时调整:
- 追加 KOL:"帮我加上 @某某某 到追踪名单"
- 调整频率:"只看 T0 级别的 KOL"
- 聚焦话题:"这周只关注 AI Agent 相关的"
- 切换模式:"我配好了 AISA API Key,切换到精准模式"
Scan to join WeChat group