每日新闻自动采集 v2.3
⚠️ 核心规则(必须严格执行)
规则1:双引擎交叉比对
每类新闻先用 web_search(channel="bocha") 搜一轮,合并结果后,对含具体数字(涨幅/产量/金额/GDP 等)的条目,再用 web_search(channel="baidu") 做二次验证。
总搜索量约 12-14 次(8 次基础 + 4-6 次验证),确保在超时范围内完成。
规则2:官方媒体优先
- 🔴 首选来源:新华社、央视新闻、人民日报、中新网、中证网、环球网、参考消息、外交部官网、国防部官网等
- 🟡 次选来源:财联社、证券时报、上海证券报、中国证券报、第一财经、经济观察报等专业财经媒体
- ⚪ 慎用来源:股吧、财富号、自媒体博客、论坛帖子、经销商网站(仅作参考,不可作为主要数据依据)
- 每条新闻必须标注来源和可信度等级(🔴/🟡/⚪)
- 含具体数字的新闻,必须双引擎验证通过才算可信,否则标注"⚠️ 单一来源"
规则3:完整内容推送到聊天
- 报告生成后,将完整报告内容直接作为输出返回,不要只返回摘要或文件路径
- 同时在
memory/daily_news_YYYY-MM-DD.md保存完整副本
架构变更历史
v2.3(2026-06-01)— 当前稳定版
- ✅ 双引擎策略:先 bocha 全量搜 → 再 baidu 验证含数据的条目(非每类都双搜)
- ✅ timeout 900 秒(实测 332 秒完成,余量充足)
- ✅ 每类 6-10 条(原 8-12,减少总量)
- ✅ 官方媒体优先级强制规则
- ✅ v2.2 连续超时问题彻底解决
v2.2(2026-05-29)
- ✅ 对话输出规则:必须完整输出 8 类编号列表,禁止速览/缩略版
- ❌ 16 次搜索 + 480/720 秒超时 → 连续超时
v2.1(2026-05-27)
- ✅ 格式硬约束:强制编号列表、来源标注、可信度标记
v2.0(2026-05-21)
- ✅ 改用 web_search(freshness=oneDay),废弃 Bing/Tavily 方案
v1.0(2026-04-21)— 已废弃
- ❌ Bing 爬虫 + Tavily API,无法可靠过滤旧闻
执行流程
步骤 1: 确定日期
计算昨日日期 YYYY-MM-DD。
步骤 2: 8 大类搜索(bocha 基础搜索)
依次调用 web_search(channel="bocha", count=10):
| # | Emoji | 类别 | 搜索关键词 |
|---|-------|------|-----------|
| 1 | 🌍 | 全球政治军事 | 全球 国际 政治 军事 外交 最新动态 |
| 2 | 🇨🇳 | 中国政治军事 | 中国 国务院 政策 改革 外交 国防 |
| 3 | 💰 | 全球财经股市 | 美股 道琼斯 纳斯达克 标普 原油 黄金 收盘 最新 |
| 4 | 📈 | 中国财经股市 | A股 沪指 深成指 创业板 板块 资金流 |
| 5 | 🤖 | AI/人工智能 | AI 人工智能 大模型 芯片 算力 最新 |
| 6 | 🔭 | 科技领域 | 量子计算 半导体 航天 卫星 6G 固态电池 |
| 7 | 📱 | 消费电子 | 苹果 三星 手机 AR VR 面板 存储芯片 |
| 8 | 🏠 | 白色家电 | 白色家电 冰箱 洗衣机 空调 美的 海尔 格力 |
步骤 3: baidu 二次验证
对含具体数字(涨幅/产量/金额/GDP/温度等)的条目,用 web_search(channel="baidu") 做验证搜索。总验证次数控制在 4-6 次。
步骤 4: 内容筛选与清洗
排除规则:
- ❌ 排除娱乐/体育/游戏/电竞内容
- ❌ 排除往年旧闻(描述中出现 2025年、2024年等往年日期)
- ❌ 排除网页噪声
保留规则:
- ✅ 优先权威媒体源
- ✅ 保留包含具体数据、人物、事件的条目
- ✅ 跨类别去重
步骤 5: 生成报告(严格遵循格式)
格式铁律
- 每条新闻必须独立成行,使用
1. 2. 3.编号,禁止用分号/逗号拼接成一段 - 每条必须标注来源和可信度,格式:
| 媒体名 🔴/🟡/⚪ - 固定 8 个类别,不得增删合并
- 每条结构:
**标题** — 一句话摘要。| 来源 🔴/🟡/⚪ - 每个类别 6-10 条
可信度标记
| 标记 | 含义 | 来源举例 | |------|------|---------| | 🔴 | 官方确认 | 新华社、央视、政府官网、公司官网/公告 | | 🟡 | 专业媒体 | 36氪、界面、财新、证券时报、IT之家 | | ⚪ | 第三方整合(仅作参考) | 论坛、博客、自媒体 |
报告模板
# 📰 每日新闻日报 v2.3 — {日期}
> 数据源:web_search(bocha) + web_search(baidu) 交叉验证
## 📌 今日一句话总结
**[用一句话概括当天最重要的 2-3 条新闻,40 字以内]**
---
## 🌍 一、全球政治军事(6-10条)
1. **新闻标题** — 一句话摘要。| 来源 🔴/🟡/⚪
...
## 🇨🇳 二、中国政治军事(6-10条)
## 💰 三、全球财经股市(6-10条)
## 📈 四、中国财经股市(6-10条)
## 🤖 五、AI 人工智能(6-10条)
## 🔭 六、科技领域(6-10条)
## 📱 七、消费电子(6-10条)
## 🏠 八、白色家电(6-10条)
---
*可信度等级:🔴官方确认 | 🟡专业媒体 | ⚪第三方整合*
步骤 6: 保存 + 推送
- 保存到
memory/daily_news_{YYYY-MM-DD}.md - 将完整报告内容直接作为本次任务的回复输出
Cron 任务配置参考
{
"name": "每日新闻日报 (v2.3)",
"schedule": { "kind": "cron", "expr": "30 8 * * 1-5", "tz": "Asia/Shanghai" },
"payload": {
"kind": "agentTurn",
"message": "按 skills/daily-news/SKILL.md 执行每日新闻日报 v2.3"
},
"timeoutSeconds": 900
}
相关文件
| 文件 | 状态 | 说明 |
|------|------|------|
| skills/daily-news/SKILL.md | ✅ 当前 | 本技能文档 |
| daily_news_query.py | ⚠️ 已废弃 | 旧版 Bing 爬虫方案 |
| daily_news_tavily.py | ⚠️ 已废弃 | 旧版 Tavily API 方案 |
| memory/daily_news_*.md | ✅ 历史存档 | 每日报告存档 |
Scan to join WeChat group