假新闻检测 Skill
当用户询问某段文字/链接内容是否为假新闻、或请求辨真假时,由 Agent 直接按下列流程执行查证,并统一按约定格式回复。无需预先配置外部检测器或环境变量,开箱可用。
提示:以上提到的额外参考文件(如 references/authoritative_sources.md、scripts/run_detector.py 等)均位于当前 skill 的安装目录,请以实际运行环境中的文件位置为准。
执行流程(Agent 直接执行)
第一步:确认输入
- 确认用户提供的是纯文本、本地文件路径,还是 URL。
- 若为 URL:用可用工具(如浏览器、抓取)获取正文;若无法获取则请用户粘贴关键内容后再检测。
- 若为本地文件:读取文件内容作为待检测文本。
第二步:提取可核实声明
- 从用户输入中提炼出可验证的事实性声明(谁、何时、何地、做了什么等),去掉主观评价与观点。
- 若无法提炼出可核实声明,在输出中说明「内容多为观点/段子,无法做事实性核实」,并仍按格式回复。
第三步:查证来源
- 使用你当前可用的工具(网页搜索、打开链接、调用搜索 API 等)针对声明查找 1~3 条支撑或反驳的来源,并记录每条来源的 URL。
- 尽量优先选用权威信源(见 references/authoritative_sources.md 中的域名);若只能找到列表外来源也予记录,并在第四步中标注提醒。
第四步:判定结论并对照权威列表
- 根据查到的来源判断:已核实/真实、未发现虚假/可信、疑似虚假、存疑、无法判断。
- 对每条来源 URL 做权威列表匹配:提取 URL 的域名,与 references/authoritative_sources.md 中条目比对(域名相等或以列表条目为后缀即视为在名单内)。
- 若验证来源 均在权威列表中:结论可写「已核实/真实」,列出验证来源(URL),无需额外提醒。
- 若验证来源中存在列表外 URL:仍可给出「已核实/可信」等结论,但必须在输出中增加「来源说明/提醒」:例如「以下部分来源未列入本技能权威名单,已由 Agent 评估为可参考/需谨慎,请自行判断」,或对列表外 URL 逐条标注「未在权威列表,请谨慎参考」。
- 若没有任何来源、或仅有列表外来源且评估为不可靠,则结论为「存疑/无法核实」,并建议用户通过权威渠道再查证。
第五步:按输出格式回复并附免责
- 按下方「输出格式」填写;结论为真实/已核实时必须包含「验证来源(URL)」;存在列表外来源时必须包含「来源说明/提醒」。
- 文末必须附免责声明:「结果仅供参考,不构成事实认定,建议结合权威信源查证。」
输出格式
当结论为「已核实/真实」或「未发现虚假/可信」时,必须包含「验证来源(URL)」;若存在列表外来源,必须包含「来源说明/提醒」。
🔍 假新闻/信息可信度检测
━━━━━━━━━━━━━━━━━━━━━━━
结论: (已核实/真实 / 未发现虚假/可信 / 疑似虚假 / 存疑 / 无法判断 等)
验证来源(URL): (仅当结论为真实/已核实时必填)
1) https://...
2) https://... (未在权威列表,请谨慎参考) ← 列表外来源时逐条标注
来源说明/提醒: (当存在列表外来源时必填)以下部分来源未列入本技能权威名单,已由 Agent 评估为可参考/需谨慎,请自行判断。(若全部来源在名单内可省略或写「以上来源均在权威名单内」。)
置信度/说明: (基于查证结果简要说明)
依据摘要: 1) ... 2) ... 3) ...
建议: (如查证渠道、保留原文、向权威媒体核实等)
━━━━━━━━━━━━━━━━━━━━━━━
免责声明: 结果仅供参考,不构成事实认定,建议结合权威信源查证。
当结论为「疑似虚假/存疑/无法判断」时,「验证来源」与「来源说明/提醒」可省略或写「无」。
边界与异常
- 文本过短(如不足一句):提示用户提供更完整内容后再检测。
- 非新闻/非可验证陈述(如纯观点、段子、主观评价):说明本 skill 针对「可验证事实性」的检测,对主观观点不做真假判定,建议用户提供可核实的事实陈述。
可选:检测脚本(非必须)
若希望用本地 fake-news-detector 项目的 FactChecker 做模型+搜索查证,可配置环境变量 FAKE_NEWS_DETECTOR_DIR 指向项目根目录,并执行 scripts/run_detector.py;脚本会返回 JSON,Agent 再对 source_urls 做权威列表匹配并填输出格式。未配置时无需调用脚本,按上述流程由 Agent 直接查证即可。
脚本约定:stdin 或 --text "..." 传入文本;stdout 输出单行 JSON,含 label(fake/real/unknown)、score、explanation、source_urls。
Scan to contact