AI Frontier Pulse — AI 前沿脉搏

追踪 AI 领域最具影响力的人物和机构的最新发言、文章与观点，自动生成结构化中文摘要。

核心能力

KOL 发言追踪 — 监控 AI 大佬在 Twitter/X 的重要发言
前沿文章采集 — 追踪 VC 博客、Substack、个人博客的深度 AI 文章
社区热议捕捉 — Reddit、Hacker News 上的 AI 热门讨论
论文/开源追踪 — arXiv 热门论文、GitHub Trending AI 项目
智能筛选输出 — LLM 过滤噪音，只保留真正有前沿价值的内容

双模式数据获取

Skill 支持两种 Twitter/X 数据获取模式，自动检测切换：

🅰 AISA API 模式（精准模式）

当环境变量 AISA_API_KEY 已配置时自动启用。

通过 AISA API（api.aisa.one）直接读取指定 KOL 的 Twitter 时间线
精准、实时、带原文链接
费用：约 $0.0004/次调用（每日运行约几毛钱人民币）
获取方式：访问 https://aisa.one 注册获取 API Key

获取 KOL 最新推文时，执行 scripts/fetch_twitter_aisa.py：

python3 scripts/fetch_twitter_aisa.py --usernames "karpathy,sama,ylecun" --limit 10

脚本返回 JSON 格式的推文列表，包含原文、时间、链接。

🅱 WebSearch 模式（免费模式）

当 AISA_API_KEY 未配置时自动降级到此模式。

通过 Agent 的 web_search 工具间接搜索 Twitter 内容
零成本、零配置
覆盖率约 60-70%，时效性有延迟

使用精准搜索语法提高命中率：

"from:karpathy" site:x.com OR site:twitter.com AI 2026
"from:sama" site:x.com new model OR release OR announcement

KOL 名单

完整的默认追踪名单见 references/kol_list.md。名单按影响力分层：

🔴 T0 — 行业领袖（每日必查）

Andrej Karpathy (@karpathy) — 前 OpenAI/Tesla AI 总监，个人知识库等开创性理念提出者
Sam Altman (@sama) — OpenAI CEO
Demis Hassabis (@demaboratory) — Google DeepMind CEO，诺贝尔奖得主
Ilya Sutskever (@iaborovikov) — SSI 创始人，前 OpenAI 首席科学家
Dario Amodei (@DarioAmodei) — Anthropic CEO
Jensen Huang — NVIDIA CEO

🟠 T1 — 技术先驱（每日查）

Yann LeCun (@ylecun) — Meta 首席 AI 科学家，图灵奖得主
Jim Fan (@DrJimFan) — NVIDIA 高级研究科学家，具身智能先锋
Andrej Karpathy 的个人博客 (karpathy.github.io)
François Chollet (@fchollet) — Keras 创建者，ARC 基准提出者
George Hotz (@realGeorgeHotz) — comma.ai/tinygrad 创始人

🟡 T2 — 深度观点（2-3天查一次）

Jack Clark (@jackclarkSF) — Anthropic 联创，Import AI Newsletter
Eliezer Yudkowsky (@ESYudkowsky) — AI 安全领域思想领袖
Emad Mostaque — Stability AI 前 CEO
Harrison Chase (@hwchase17) — LangChain 创始人

完整名单含 VC 机构和媒体源，见 references/kol_list.md。

执行流程

当触发 AI 前沿简报采集时，按以下流程执行：

Step 1：确定模式和时间范围

import os
mode = "aisa" if os.environ.get("AISA_API_KEY") else "websearch"
# 默认查最近 24 小时，可自定义

Step 2：采集 Twitter/X KOL 发言

AISA 模式： 运行 scripts/fetch_twitter_aisa.py，自动遍历 T0+T1 名单获取最新推文。

WebSearch 模式： 依次执行以下搜索（一次最多搜索 3-5 个 KOL，避免信息过载）：

# T0 KOL 搜索
"karpathy" (AI OR model OR training OR agent) site:x.com {当前月份} {当前年份}
"Sam Altman" (GPT OR OpenAI OR release OR model) site:x.com {当前月份} {当前年份}
"Demis Hassabis" (Gemini OR DeepMind OR AI) site:x.com {当前月份} {当前年份}

# T1 KOL 搜索
"Yann LeCun" (AI OR AGI OR LLM) site:x.com {当前月份} {当前年份}
"Jim Fan" (embodied OR agent OR NVIDIA) site:x.com {当前月份} {当前年份}
"George Hotz" (tinygrad OR AI OR model) site:x.com {当前月份} {当前年份}

Step 3：采集前沿文章与深度内容

搜索以下来源（使用 web_search 工具）：

# VC 博客 & 深度分析
site:sequoiacap.com AI {当前月份} {当前年份}
site:a16z.com AI agent OR model OR infrastructure {当前年份}
site:greylock.com AI {当前年份}

# Substack & Newsletter 知名作者
site:substack.com (AI OR LLM OR agent) trending {当前月份} {当前年份}
"Import AI" newsletter Jack Clark {当前月份} {当前年份}
"One Useful Thing" Ethan Mollick AI {当前月份} {当前年份}
"The Batch" Andrew Ng deeplearning.ai {当前月份} {当前年份}

# 个人博客 & 长文
site:karpathy.github.io {当前年份}
site:lmsys.org {当前月份} {当前年份}
site:lilianweng.github.io {当前年份}
"Simon Willison" AI {当前月份} {当前年份}

Step 4：采集社区热议

# Reddit AI 社区
site:reddit.com/r/MachineLearning hot {当前月份} {当前年份}
site:reddit.com/r/LocalLLaMA best {当前月份} {当前年份}
site:reddit.com/r/ClaudeAI OR /r/ChatGPT breakthrough {当前月份} {当前年份}

# Hacker News
site:news.ycombinator.com AI (show OR launch OR paper) {当前月份} {当前年份}

Step 5：采集论文 & 开源

# arXiv 热门论文
site:arxiv.org AI (transformer OR agent OR reasoning) {当前月份} {当前年份}
site:huggingface.co (new model OR release OR trending) {当前月份} {当前年份}

# GitHub Trending
github trending AI machine-learning {当前周}

Step 6：智能筛选与输出

用 LLM 对采集到的全部内容进行筛选和总结，过滤标准：

✅ 保留：新模型发布/重大更新、引领新方向的观点（如 Karpathy 的个人知识库）、重要技术突破、行业重大合作/收购、有深度洞见的长文
❌ 过滤：日常闲聊、营销推广、重复信息、纯转发无评论

输出格式

格式规范要求

来源与时间合并显示：不要使用 "⏰ 最早出现：" 或 "🔗 来源：" 等标签前缀，而是将来源信息和时间直接合并在简洁的行中。
来源行格式：⦁来源：{来源名称1} | {来源名称2} | {YYYY年M月D日}，多个来源用 | 分隔，时间放在末尾。
链接行格式：⦁🔗 [{来源1名称}]({URL1}) | [{来源2名称}]({URL2})，多个链接用 | 分隔，放在同一行。
时间取最早：采集时对比各来源的发布时间，取最早的那个标注。

按以下格式输出中文结构化简报：

# 🧠 AI 前沿脉搏 — {日期}

## 🔥 今日头条（最重要的 1-3 条）

### 1. {标题}
 ⦁来源：{主要来源名称} | {YYYY年M月D日}
 ⦁摘要：{2-3 句中文摘要}
 ⦁为什么重要：{一句话说明前沿价值}
 ⦁🔗 [{来源1名称}]({URL1}) | [{来源2名称}]({URL2}) | [{来源3名称}]({URL3})

---

## 💡 KOL 重要发言

### {KOL 名字}（@{handle}）
 ⦁来源：{平台名} | {YYYY年M月D日}
> "{原文摘录或翻译}"
 ⦁解读：{简要解读}
 ⦁🔗 [{平台名}]({原文URL}) | [{转载/报道平台}]({URL})

（按 T0 → T1 → T2 优先级排列）

---

## 📰 前沿文章 & 深度分析

### {文章标题}
 ⦁来源：{作者} | {机构/平台} | {YYYY年M月D日}
 ⦁核心观点：{3-5 个要点}
 ⦁🔗 [{原始发布平台}]({URL}) | [{其他引用/讨论}]({URL})

---

## 🔬 论文 & 开源

### {论文/项目名}
 ⦁来源：{arXiv/GitHub/HuggingFace} | {YYYY年M月D日}
 ⦁简介：{一句话说明}
 ⦁🔗 [{来源1}]({URL}) | [{相关讨论/报道}]({URL})

---

## 🗣️ 社区热议

### {话题}
 ⦁来源：{Reddit/HN 子版块} | {YYYY年M月D日}
 ⦁讨论焦点：{核心观点}
 ⦁🔗 [{社区讨论帖}]({URL}) | [{相关原始来源}]({URL})

---

> 📊 本期共采集 {N} 条信息，筛选后保留 {M} 条
> 🔄 数据模式：{AISA API 精准模式 / WebSearch 免费模式}

多源交叉比对说明

在采集过程中，同一事件可能出现在多个来源（如某论文同时在 arXiv、Twitter、Reddit、HN 上被讨论）。输出时应：

将所有发现该消息的来源链接全部用 | 分隔放在同一行的 🔗 行中
对比各来源的发布时间，取最早的标注在来源行末尾
如果不同来源的信息有补充或差异，在摘要中综合呈现

自定义配置

用户可通过对话随时调整：

追加 KOL："帮我加上 @某某某到追踪名单"
调整频率："只看 T0 级别的 KOL"
聚焦话题："这周只关注 AI Agent 相关的"
切换模式："我配好了 AISA API Key，切换到精准模式"