bid-news-collection-light — 跨行业网络安全标讯采集 Skill(独立版)
版本: v1.6.1
创建日期: 2026-06-02
适用行业: 金融、政府、能源、电信、医疗、教育、交通、制造、互联网等全行业
配置文件: config.json(首次使用请运行 python3 scripts/first_run_setup.py 配置)
✅ 这是完全独立的 Skill 版本 — 不依赖任何 full 版本,已移除所有个人路径和敏感配置。 首次导入后需要运行配置向导才能正常使用。
零、首次运行设置
⚠️ 首次使用必须先配置!
方式一:交互式配置向导(推荐)
python3 scripts/first_run_setup.py
向导将引导你配置:
- 输出目录 — 标讯报告的存储路径
- IMA 笔记本 — 自动同步标讯到企业微信智能文档(可选)
方式二:手动编辑 config.json
编辑 config.json 中的以下字段:
{
"output_dir": "/your/report/directory",
"ima": {
"folder_id": "folderxxxxxxxxxxxxxxxx",
"env_client_id": "IMA_OPENAPI_CLIENTID",
"env_api_key": "IMA_OPENAPI_APIKEY"
}
}
在 ~/.zshrc 或 shell 配置中设置环境变量:
export IMA_OPENAPI_CLIENTID="你的ClientID"
export IMA_OPENAPI_APIKEY="你的APIKey"
完成后验证
python3 scripts/run.py --date $(date +%Y%m%d) --dry-run
预期输出:执行计划 + 路径变量输出,无错误退出。
每日自动采集"当日 + 前5天"共6天的全行业网络安全相关标讯(招标公告、中标结果、候选人公示),覆盖50+采集渠道(国家级5/金融行业12/政府机构8/能源电力6/电信运营商4/医疗教育4/交通制造4/商业聚合12/辅助5),生成标准化 Markdown 报告 + Excel 数据报告,并同步至 IMA「招标资讯」笔记本。
二、触发场景
触发词(用户意图匹配)
- 「采集标讯」「网安标讯」「招标采集」「bid news」「安全标讯」「跨行业标讯」
- 「今日标讯」「每日标讯」「更新标讯」「全行业标讯」
- 「网络安全标讯收集报告」「招标资讯」「安全招标」
- 「运行标讯采集」「执行标讯采集」「行业标讯分析」
适用场景
- 每日定时采集(自动化/手动):采集当日及前5天标讯
- 按需采集:指定日期范围的标讯检索
- 单渠道深挖:针对特定渠道(如深交所、知了标讯)的重点搜索
- 持续跟进查询:查看特定项目的跟进状态和倒计时
三、执行步骤(7步标准流程)
Step 1:确定采集日期范围
- 以
YYYYMMDD为目标日期(默认 = 今天) - 采集周期 = 目标日期 ~ 目标日期-5天(含当日,共6天)
- 输出:
采集日期、采集周期变量
Step 2:多渠道搜索采集
按优先级在以下渠道搜索标讯(详见 references/channels.md 完整40渠道配置):
| 优先级 | 分类 | 渠道数 | 代表渠道 | 搜索方式 |
|:------:|------|:------:|----------|----------|
| P0 | 国家级官方平台 | 5 | 中国政府采购网(ccgp)、招标投标公共服务平台(cebpubservice)、全国公共资源交易平台(ggzy)、中央政府采购网(zycg)、中国采购与招标网(chinabidding) | site: + 关键词 |
| P1 | 金融行业 | 12 | 深交所(ebs)、上交所(sse)、中金所(cffex)、央行(jzcg)、国开行(cg.cdb)、成方金融(cfid)、金融采购网(cfcpn)、知了标讯、标探云脑、银保信、中国银联、证保信 | WebFetch + site: |
| P1 | 政府机构 | 8 | 政府采购网各省分站、各地公共资源交易中心、机关事务管理局采购、卫健委采购平台 | site: + 关键词 |
| P1 | 能源电力 | 6 | 国家电网(ecp.sgcc)、南方电网(bidding.csg)、国家能源(chnenergybidding)、中石化(sinopec-ec)、电力招标(dlzb)、电力能源(dlnyzb) | site: + 关键词 |
| P1 | 电信运营商 | 4 | 中国移动(b2b.10086)、中国电信(caigou.chinatelecom)、中国联通(chinaunicombidding)、中国广电 | site: + 关键词 |
| P2 | 医疗教育 | 4 | 卫健委采购平台、医学院校采购网、公立医院采购平台、教育部政府采购网 | site: + 关键词 |
| P2 | 交通制造 | 4 | 交通运输部采购网、国铁集团采购平台、中车集团、中船集团采购平台 | site: + 关键词 |
| P2 | 商业聚合平台 | 12 | 采招网(bidcenter)、千里马(qianlima)、乙方宝(yifangbao)、政采云(zcygov)、军队采购网(plap) 等 | site: + 关键词 |
| P3 | 辅助渠道 | 5 | 深圳公共资源(szexgrp)、蚂蚁投标(mayitb)、各机构官网、行业垂直平台、地方性采购平台 | site: + 直接搜索 |
搜索关键词(四线 AND/OR 体系):
按四条业务线分别构造查询,每线内 OR,与采购语境词 AND。详见 references/channels.md 关键词配置。
| 业务线 | 核心关键词(OR) | 采购语境(AND) | 覆盖范围 | |:------:|------------------|-----------------|----------| | 安全服务线 | 等保、等级保护、密评、密码评估、渗透测试、攻防演练、重保、护网、安全评估、安全检测、安全审计、风险评估 | 采购/招标/服务/项目/征集 | 合规测评、攻防实战、检测审计 | | 安全产品线 | 防火墙、IPS、IDS、WAF、漏洞扫描、态势感知、堡垒机、数据库审计、邮件安全、DLP、零信任、EDR、XDR、数据安全、数据防泄漏 | 采购/招标/设备/项目/征集 | 网安设备、数据安全产品 | | 运维/平台线 | 安全运营、安全运维、安全驻场、SOC、安全管理平台、安全加固、合规、安全整改、维保 | 采购/招标/服务/项目 | 运营中心、驻场运维、整改维保 | | 行业搜索线 | 工控安全、电力监控安全、物联网安全、云安全、数据分类分级、主机安全、终端安全、医疗数据安全、教育行业安全、交通物流安全 | 采购/招标/服务/项目/设备/征集 | 工控/电力/物联网/云/医疗/教育/交通垂直行业 + 数据治理 |
搜索策略:
- 四线必覆盖:每条线 × 行业类型(金融/政府/能源/电信/医疗/教育/交通等)轮询,共 8-10 轮
- 行业线与前三条服务/产品/运维线形成横纵交叉:前三线按采购内容分(纵向),行业线按应用领域分(横向)
- 每查询附加行业关键词(如
金融/银行/证券/保险或政府/医疗/教育/能源/电信/交通)+2026时效过滤 - OR 关键词单次 2-3 个,避免 WebSearch 截断
- 重点关注:金融/政府/能源/电信/医疗/教育等行业的网络安全采购
- 匹配到项目后,用 WebFetch 打开原文验证详情
- ⚠️ 渠道扩至50+个后单次采集量级提升,建议分批执行:P0→P1(金融+政府+能源+电信)→P2(医疗+教育+交通)→P3,每批间隔30秒避免限流
Step 3:信息提取与分类
对每条标讯提取 12 个标准字段(详见 references/fields_spec.md):
| # | 字段 | 说明 | |---|------|------| | 1 | 项目名称(主题) | 完整项目标题 | | 2 | 内容总结 | 50-100字核心摘要 | | 3 | 服务类型 | 安全防护/攻防演练/等保测评/安全设备/安全运营... | | 4 | 招标方 | 完整机构名称 | | 5 | 机构类型 | 央行系/国有银行/股份制银行/城商行/证券/保险/资管/政府机构/能源电力/电信运营商/医疗卫健/教育高校/交通运输/制造业/互联网科技/军工航天/商贸零售 | | 7 | 金额(万元) | 数字,未公开填"未公开" | | 8 | 采购方式 | 公开招标/竞争性磋商/竞争性谈判/单一来源/询价 | | 9 | 状态 | 征集中/评审中/候选人公示中/中标公示中/已中标/已截止 | | 10 | 原文链接 | 完整URL | | 11 | 链接核实状态 | ✅已核实 / ⚪待核实 / ❌不通过 | | 12 | 备注 | 排名信息、趋势分析、关联项目等 |
分类规则:
- 本期重大更新:本执行周期内新发现的结果公告/候选人公示/新招标公告
- 近期结果公示汇总:5/12起所有已出结果的项目汇总表
- 本期已截止:截止日期已过但结果尚未公布的项目
- 持续跟进项目:仍在招标/征集中(未截止)的项目,按截止日期排序
状态标记:
- 🔴 重大更新(新中标/公示)
- 🟡 重要更新(候选人公示/单一来源)
- 🆕 新增招标/跟进
- ⚠️ 紧迫(3天内截止)
- ⚠️⚠️ 极度紧迫(今天或明天截止)
Step 4:链接核实
- 对每条标讯用 WebFetch 访问原文链接
- ✅已核实 = 链接可访问 + 内容与标讯描述一致
- ⚪待核实 = 来源为聚合平台/搜索引擎摘要,未打开原文
- ❌不通过 = 链接失效/404/内容不匹配
- 目标核实率 ≥ 85%
Step 5:生成 Markdown 报告
按 8 段式结构生成报告(详见 assets/report_template.md):
一、采集概况 → 总量/新增/跟进/核实率统计表
二、本期重大更新 → 逐条详细展示(字段表+候选人表)
三、近期结果公示汇总 → 统一表格(序号+项目+中标方+金额+日期)
四、本期已截止 → 截止但无结果的项目
五、持续跟进项目 → 招标中/征集中(按截止日期排序)
六、近期重点时间节点 → 倒计时表格(⚠️⚠️ 极度紧迫标记)
七、市场动态分析 → 本期要点(5-8条)+ 市场趋势(4-6条)
八、采集说明 → 数据来源+关键词+核实率+报告生成时间
输出路径: {output_dir}/网络安全标讯收集报告_YYYYMMDD.md(output_dir 由 config.json 中的 output_dir 字段指定)
Step 6:生成 Excel 数据报告
使用 scripts/gen_excel.py 生成:
Sheet 1「标讯明细」(16列): 序号 | 类型 | 项目名称 | 内容总结 | 服务类型 | 招标方 | 机构类型 | 发布时间 | 截止/公示日期 | 金额(万元) | 采购方式 | 状态 | 中标方/候选人 | 原文链接 | 链接核实 | 备注
- 颜色编码:🆕新增=黄底 | ✅结果=绿底 | ⚠️截止=橙底 | 🔄跟进=蓝底
- 标题行:深蓝底白字
- 冻结窗格:A4(表头不动)
Sheet 2「统计分析」:
- 一、采集概况统计(4组KPI指标)
- 二、按机构类型分布(10类)
- 三、按服务类型分布(10类)
- 四、机构类型分布柱状图(9色配色)
- 五、近期关键时间节点
输出路径: {output_dir}/网络安全标讯数据报告_YYYYMMDD.xlsx(output_dir 由 config.json 中的 output_dir 字段指定)
Step 7:同步到 IMA 笔记本
使用 scripts/ima_sync.py 调用 IMA OpenAPI:
- 端点:
POST https://ima.qq.com/openapi/note/v1/import_doc - 认证头:
ima-openapi-clientid+ima-openapi-apikey(来自环境变量,变量名由config.json中的ima.env_client_id/ima.env_api_key指定) - 笔记本:
config.json中ima.folder_id字段(未配置则自动跳过同步) - 标题格式:
Workbuddy网络安全标讯-YYYY-MM-DD - 内容格式: 在报告正文前加
# Workbuddy网络安全标讯-YYYY-MM-DD\n\n标题行 - Body:
{"content_format": 1, "content": "完整Markdown内容", "folder_id": "{ima.folder_id}"} - 环境变量加载:
source ~/.zshrc后读取配置中指定的环境变量
四、输出标准
Markdown 报告质量要求
| 检查项 | 标准 | |--------|------| | 结构完整性 | 8个章节全部覆盖 | | 数据准确性 | 金额/日期/中标方与原文一致 | | 链接核实率 | ≥ 85%(目标 ≥ 90%) | | 金额单位 | 统一为万元人民币 | | 时间格式 | YYYY-MM-DD(如 2026-05-25) | | 状态标记 | 🔴🟡🆕⚠️⚠️⚠️ 正确使用 | | 表格对齐 | Markdown 表格列对齐 | | 趋势分析 | 至少 4 条市场趋势洞察 |
Excel 报告质量要求
| 检查项 | 标准 | |--------|------| | Sheet数量 | 2个(标讯明细 + 统计分析) | | 颜色编码 | 4色编码正确应用 | | 图表 | 至少1个柱状图 | | 列宽 | 适配内容(名称列 38-40,链接列 55) | | 冻结窗格 | A4 冻结 | | 字体 | 微软雅黑(标题14/表头11/正文10) |
IMA 同步质量要求
| 检查项 | 标准 |
|--------|------|
| HTTP 状态码 | 200 |
| 返回 code | 0(成功) |
| 标题格式 | Workbuddy网络安全标讯-YYYY-MM-DD |
| 笔记本 | config.json 中配置的 folder_id |
💡 提示: 如果未配置 IMA(folder_id 为空),ima_sync.py 会友好跳过并提示配置方法。
五、执行记录
每次执行完成后更新:
- 工作记忆: 在配置的 memory_dir 中写入每日日志(如启用)
- 长期记忆: 在配置的 memory_path 中更新重点时间节点(如启用)
💡 提示: 自动化记忆功能通过 config.json 中的 automation.memory_path 和 automation.memory_dir 配置,留空则跳过。
六、依赖
- Python 3.8+ with
openpyxl - WebFetch 工具(访问标讯原文)
- WebSearch 工具(搜索引擎关键词采集)
- IMA OpenAPI 凭证(环境变量,名称由
config.json中ima.env_client_id/ima.env_api_key指定,默认IMA_OPENAPI_CLIENTID+IMA_OPENAPI_APIKEY) - curl 或 Python
urllib.request(IMA API 调用)
七、注意事项
- IMA 同步可能因 API 密钥过期失败(HTTP 401, code=200002),需前往 https://ima.qq.com/agent-interface 刷新
- WebSearch 可能遗漏部分渠道(部分平台有反爬保护),标讯需结合 WebFetch 原文核实
- 金额单位必须统一为万元,原文为"元"时需转换
- JS 渲染页面为部分采购平台采用 JS 渲染,WebFetch 可能无法完整提取,需配合搜索引擎摘要
- 持续跟进项目的截止日期需每日更新倒计时
- 执行前先读取上次执行记录(memory.md),了解已有标讯避免重复
- 不同行业关注点不同:金融行业关注等保/密评;政府机构关注合规/数据安全;医疗行业关注患者数据保护;教育行业关注科研数据/校园网络安全
八、已知限制
- IMA 同步依赖外部 API 密钥 — 密钥过期后需手动刷新,无法完全自动化
- 搜索引擎索引延迟 — 新发布的标讯可能 1-3 天后才能通过 WebSearch 检索到
- JS 渲染页面 — 部分采购平台(深交所、上交所、各大企业SPA页面)无法通过 WebFetch 直接提取,需依赖搜索引擎摘要
- 聚合平台会员限制 — 知了标讯、采招网等平台部分内容需登录查看,标记为"⚪待核实"
- 金额格式不统一 — 原文可能为"元"、"万元"、"以最终合同为准"等,虽然
safe_float()已覆盖常见格式,但极端非标准写法仍需人工判断 - 搜索引擎/官网反爬 — 部分政府采购网/企业采购平台有严格反爬,需通过搜索引擎摘要或轮换User-Agent
九、版本历史
| 版本 | 日期 | 变更内容 | |------|------|---------| | v1.0 | 2026-05-25 | 初始版本:SKILL.md + 3 references + 3 scripts + 3 assets,体检评分 92/100 | | v1.1 | 2026-05-25 | P1修复:gen_excel.py SVC金额聚合 / ima_sync.py 大内容拆分;新增 26 单元测试 | | v1.2 | 2026-05-25 | P0修复:新增 config.json 统一配置;P1完善:safe_float() 金额解析容错 + 19 个测试 | | v1.3 | 2026-05-25 | 新增渠道:中国移动 + 国家电网;渠道总数 10→12 | | v1.4 | 2026-05-25 | 关键词体系重构:三线 AND/OR 体系(36词),6轮搜索策略 | | v1.5 | 2026-05-25 | 新增行业搜索线7词 → 四线43词,8轮横纵交叉搜索 | | v1.6 | 2026-05-25 | 渠道大扩展:12→40个渠道,6大类别 | | v1.6.1 | 2026-06-02 | 独立版:去掉full版本关联,扩展为跨行业通用版本(金融/政府/能源/电信/医疗/教育/交通/制造等);机构类型枚举21种;渠道50+ |
微信扫一扫