Back to skills
extension
Category: OtherNo API key required

基金会尽职调查

foundation-due-diligence

personAuthor: user_26b924d6hubcommunity

Foundation Due Diligence Skill

Description

对慈善基金会/社会组织进行全面尽职调查的技能。输入任意基金会名称,自动全网搜索真实信息,按照4大调查领域、11个模块、69个检查点框架生成结构化报告,输出Word和PDF文件。

作者信息

  • 作者:user_26b924d6
  • 版本:3.7.1

Skill 能力说明

本技能用于对中国境内合法登记的慈善基金会/社会组织进行全面尽职调查,涵盖以下4大领域:

  1. 合规尽调(6个模块,51个检查点):组织资格、组织架构、项目合规、财务合规、信息公开、诉讼仲裁
  2. 项目效能尽调(3个模块,12个检查点):项目概况、成本效益分析、可持续性与规模化潜力
  3. 组织生态评估(4个检查点):核心竞争力、行业公信力、资源链接力、政策影响力
  4. 舆情调查(2个检查点):媒体曝光、公众投诉

适用场景

  • 对拟合作的慈善基金会进行合规尽调
  • 评估基金会的项目执行效能和社会影响力
  • 审查基金会的信息公开和财务透明度
  • 对基金会进行舆情监测和风险排查
  • 为捐赠决策提供依据

输入

用户输入基金会/社会组织的名称(如"鄂尔多斯市聚祥公益基金会")。

输出

  1. 完整的尽职调查报告(Markdown格式,包含全部69个检查点的详细内容)
  2. Word文件(可供下载)
  3. PDF文件(可供下载)

核心原则

  • 必须搜索:每个检查点都必须调用搜索插件查询,严禁留空或写"暂无数据"
  • 有数据才能判断:没有搜索到信息 → 标"⚠️待核实",绝不能默认标"✅符合"
  • 禁止编造:所有信息必须来自搜索结果
  • 来源必须标注:每个检查点必须写明数据来自哪个网站和URL
  • 查询结果要详细全面:不要只写一句话概括
  • 交叉验证:关键信息至少从2个来源交叉验证

🔴🔴🔴 执行流程(严格按顺序,不可跳步)🔴🔴🔴

第0步:发现所有可用数据入口(必须首先完成,否则后续必缺数据)

这是最关键的一步。 90%的"查不到数据"问题都是因为跳过了这一步直接去填检查点。

0.1 搜索慈善中国

搜索 "[组织名] 慈善中国" → 找到组织详情页URL → 用链接读取插件访问

记录以下信息:

  • 统一社会信用代码、法定代表人、注册资金、成立日期
  • 业务主管单位、登记管理机关
  • 年度工作报告(最近3年)
  • 募捐方案备案
  • 信息公开情况

0.2 搜索官网并发现全站静态页面

搜索 "[组织名] 官网" → 找到官网首页URL

然后立即用链接读取插件访问以下URL(按顺序试,哪个能用就用哪个):

https://[官网域名]/sitemap.xml
https://[官网域名]/robots.txt    ← robots.txt里可能有Sitemap行
https://[官网域名]/sitemap.txt
https://[官网域名]/sitemap.html

sitemap是金矿:它会列出网站所有被承认的页面URL。从中提取:

  • 包含"年报""审计""财务""捐赠""公示""章程""制度""理事"的URL → 高优先级
  • 包含"项目""活动""新闻"的URL → 中优先级

0.2.1 检测是否为万网/中企动力(wezhan.cn)建站(关键!)

访问官网首页或信息公开页时,检查页面源码是否包含以下特征:

  • Body.js (页面内容通过此JS注入)
  • img.wanwang.xin (万网CDN域名)
  • wezhan中企动力
  • slideset (分页数据组件)

如果检测到以上任意特征 → 必须立即执行0.2.2和0.2.3,不可跳过!

已知的wezhan特征Body.js URL模式

https://img.wanwang.xin/pubsf/{siteId前5位}/{siteId}/cdn-static-pages/pages/pc/{pageId}_zh-cn.html.Body.js?version=xxx

0.2.2 🔴🔴🔴 提取Body.js中的slideset图片并OCR(wezhan网站强制执行)

⚠️ 这不是可选步骤!只要0.2.1检测到wezhan特征,就必须执行本步骤。即使PDF年报已经下载,也必须执行本步骤,因为:

  • PDF年报最晚只到2024年(年报有编制周期,永远滞后)
  • slideset图片包含最新到2026年的捐赠/支出明细,是PDF年报无法覆盖的
  • site:搜索找到的newsinfo静态页数据可能只到2024年2月,也不是最新的
  • PDF和slideset图片是互补的,缺一不可!PDF提供权威财务汇总数据,slideset图片提供最新捐赠/支出明细

🔴 已发生的真实错误:Agent下载了PDF年报后就跳过了slideset图片OCR,导致报告只体现到2024年数据,而官网实际上已更新到2026年。这是完全不可接受的。

执行步骤(必须完整执行,缺一不可):

Step A:从页面源码提取Body.js URL

用链接读取或fetch_web访问目标页面(信息公开页优先),在HTML源码中搜索 Body.js,找到完整URL。

Step B:获取Body.js内容

🔴🔴🔴 关键注意:直接用网页读取工具(如fetch_web)访问Body.js URL会返回403 Forbidden!

你必须找到一种能设置HTTP Referer头的下载方式。Referer头的值必须为目标页面URL(如 https://www.jxfoundation.com/xxgk11),不能为空。

如果你用网页读取工具拿到了403,不要放弃! 403只是因为缺少Referer头,不是真的无法访问。换一种能设置请求头的方式重试。

已发生的真实错误:Agent用网页读取工具访问Body.js得到403,就写了"Body.js状态:403 Forbidden,无法提取"或"由于网络代理限制,无法下载",然后放弃了slideset图片OCR和PDF下载,导致2025-2026年最新数据全部丢失。完全错误!只要能设置Referer头就一定能下载成功。

Step C:从Body.js中提取slideset图片URL

在Body.js内容中搜索 slideset,找到所有 ctype="slideset" 的组件。 在每个slideset组件内搜索 content-box-inner,提取所有 background-image:url(//xxx) 中的图片URL。

图片URL格式://img.wanwang.xin/contents/sitefiles2050/{siteId}/images/{imageId}.png.jpg

识别哪个slideset对应哪个栏目:slideset组件通常紧跟在栏目标题(如"捐赠收入""公益支出")后面,根据上下文位置判断。图片编号越大通常数据越新。

🔴🔴🔴 必须提取每个slideset组件下的全部图片!常见错误:只提取了前2-3张旧图片就停了,漏掉了编号最大的最新图片。

聚祥基金会实测示例

  • 捐赠收入slideset有3张图:48779324.png(2020-2023旧数据)、175846051.jpg(2024-2025新数据)、176026104.jpg(2026年3-4月最新数据)
  • 公益支出slideset有8张图:前6张是2020-2024旧数据,最后2张174451511.png(2025年7-8月)和176026132.jpg(2026年1-4月)是最新数据
  • 如果只提取了前几张,就会漏掉2025-2026年的最新数据,导致报告只体现到2024年

提取技巧:在Body.js文本中搜索所有 background-image:url( 出现的位置,逐一提取URL,确保不遗漏。

Step D:下载图片

🔴 同Body.js,图片下载也需要设置Referer头,否则可能403。Referer头的值为官网页面URL。

Step E:OCR识别图片

使用图片识别/OCR工具读取每张下载的图片,提取表格数据。重点提取:

  • 捐赠收入明细(捐赠方、金额、日期)
  • 公益支出明细(资助对象、金额、日期)
  • 年检年审数据

🔴 建议按图片编号从大到小OCR,优先识别最新数据。 如果时间有限,至少要OCR编号最大的2-3张图片(这些是最新数据),旧图片可以跳过(因为旧数据通常已被site:搜索的静态页覆盖)。

0.2.3 🔴🔴🔴 下载Body.js中的PDF报告(wezhan网站强制执行)

⚠️ 同样是强制步骤!PDF年度工作报告包含最权威的财务数据(净资产、公益支出比例、管理费用等)。

执行步骤:

Step A:在Body.js内容中搜索 filedownload

提取所有 /filedownload/{数字ID} 模式的链接。

Step B:逐个下载PDF

🔴 同Body.js,PDF下载也需要设置Referer头,否则会403。Referer头的值为官网页面URL。

⚠️ 如果不确定哪个ID对应哪个文件,先下载前10个ID,读取标题页来识别,找到年度工作报告后再重点解析。

Step C:识别PDF内容

用PDF解析工具读取每个PDF的标题页,识别它是:

  • 年度工作报告(最重要!含净资产、公益支出、管理费用等全部财务数据)
  • 审计报告
  • 专项信息审核报告
  • 章程
  • 其他制度文件

重点提取年度工作报告中的数据:

  • 年末净资产合计
  • 慈善活动支出金额及占上年末净资产比例
  • 管理费用金额及占总支出比例
  • 捐赠收入总额
  • 各公益项目支出明细

如果不确定哪个ID对应哪个文件:先下载前10个ID,读取标题页来识别,找到年度工作报告后再重点解析。

0.3 用site:搜索发现深层静态页面

每个关键词必须单独搜索一次(不要组合,单独搜发现更多):

| 搜索词 | 目的 | |--------|------| | site:[官网域名] 捐赠 | 找捐赠收入/支出页面 | | site:[官网域名] 年报 | 找年报页面 | | site:[官网域名] 审计 | 找审计报告页面 | | site:[官网域名] 财务 | 找财务数据页面 | | site:[官网域名] 章程 | 找章程页面 | | site:[官网域名] 制度 | 找管理制度页面 | | site:[官网域名] 项目 | 找项目信息页面 | | site:[官网域名] 理事 | 找理事会信息页面 |

关键发现:很多基金会的newsinfo/detail详情页是纯静态的,包含完整数据。这些页面在官网导航里看不到(因为导航指向的是动态列表页),但site:搜索能找到。

0.4 整理可用数据源清单

完成0.1-0.3后,你应该有了一份清单:

| 数据源类型 | URL | 可覆盖的检查点 | 优先级 | |-----------|-----|--------------|--------| | 慈善中国详情页 | ... | 1-7, 22-51 | 最高 | | Body.js中提取的slideset图片OCR结果 | ... | 捐赠收支、理事会、年检年审等 | 最高(wezhan网站) | | Body.js中提取的PDF年度工作报告 | ... | 40-41(公益支出比例、管理费用)及全部财务数据 | 最高(wezhan网站) | | 官网sitemap中的静态页 | ... | 各检查点 | 高 | | site:搜索发现的静态页 | ... | 各检查点(⚠️注意:可能不是最新数据) | 中 |

⚠️ 重要提醒

  • site:搜索找到的newsinfo静态页数据可能只到2024年2月,不是最新的
  • Body.js中的slideset图片和PDF报告才包含2025-2026年最新数据
  • 检查点40/41(公益支出比例、管理费用比例)必须用Body.js/PDF中的实际数字核实,不能用间接推理代替

特别标注:如果检测到wezhan.cn建站,必须单独列出Body.js URL、提取到的slideset图片URL清单、以及所有filedownload ID清单。

没有这份清单就不许往下走。


第1步:读取高优先级静态页面

从第0步的清单中,按优先级读取页面内容:

优先级0:Body.js提取的slideset图片OCR结果和PDF年度工作报告(wezhan网站独有,最新最全数据) 优先级1:慈善中国详情页(政府数据,最权威) 优先级2:site:搜索发现的newsinfo/detail静态页(⚠️可能不是最新数据,需要与Body.js数据对比时间范围) 优先级3:sitemap中发现的高优先级URL 优先级4:官网首页(只能看到导航结构和图片链接)

读取每个页面时:

  • 如果页面内容是文字 → 直接提取数据
  • 如果页面内容是图片 → 记录图片URL,后续OCR识别
  • 如果页面显示PDF文件名但无下载链接 → 记录文件名,用site:搜索找PDF直接链接
  • 如果页面某个栏目内容为空(如"捐赠收入"下方空白) → 这是动态加载的内容,必须按第2步处理

第2步:处理动态/空白内容(遇到空内容时执行)

⚠️ 注意:如果你是wezhan网站,Body.js方案已在0.2.2强制执行过,本步骤仅处理其他类型的动态内容。

当你访问一个页面,发现某个栏目(如"捐赠收入""公益支出")下方内容为空或只显示部分数据,说明这是动态加载/分页内容

遇到这种情况,必须按以下顺序尝试,不能跳过:

方法1:site:搜索找静态替代页

搜索 site:[官网域名] [空白栏目关键词]

示例:如果你发现"捐赠收入"栏目为空,搜索 site:jxfoundation.com 捐赠

原理:很多网站的列表页是动态的,但具体的详情页(newsinfo/detail页面)是静态的。搜索引擎已经收录了这些静态页,site:搜索能直接找到。

实测证明:聚祥基金会官网的"捐赠收入"栏目是动态加载的,但 site:jxfoundation.com 捐赠 能搜到 newsinfo/2026755.html 这个静态页,包含从2020年到2024年2月的捐赠收支数据。但注意:静态页可能不是最新的,最新数据需用方法0获取。

方法2:sitemap中找替代URL

回看第0步收集的sitemap,找出与空白栏目相关的URL,直接用链接读取插件访问。

方法3:直接请求分页URL

在原URL后追加常见分页参数,用链接读取插件逐个尝试:

原URL?page=2
原URL&page=2
原URL_2.html
原URL?pageNo=2
原URL?currentPage=2
原URL?p=2
原URL/2.html

至少尝试3种模式。

方法4:找后台API

从页面HTML源码搜索 api ajax json fetch getList 等关键词,找到API地址后直接请求。

方法5:OCR识别当前页面可见图片

如果页面上有图片(如理事会名单、年报截图、基本信息图片等),用OCR/图片识别工具读取内容。

对于非wezhan网站的图片型数据,直接记录图片URL并用OCR识别即可。

方法6:诚实标注

如果以上方法都无法获取完整数据,必须标注:

"该数据来自动态分页内容,本次调查已获取截至XXXX的数据。建议:1)访问慈善中国查看完整年报;2)人工访问官网翻页核实。"

绝对禁止:假装数据完整、标"✅符合"但实际只看了第一页、不尝试就放弃。


第3步:搜索其他数据源

  1. "[组织名] 微信公众号" → 获取组织动态、活动信息
  2. "[发起方企业名] 企查查" → 发起方公司信息
  3. "[组织名] 行政处罚 诉讼" → 法律风险
  4. "[组织名] 年度审计报告" → 财务数据
  5. "[组织名] 年报 财务" → 补充财务
  6. "[组织名] 负面 违规" → 负面信息
  7. "[组织名] 新闻 媒体报道" → 媒体报道
  8. 按需补充搜索

第4步:填写69个检查点

🔴🔴🔴 必须严格按照 framework.md 的69个检查点逐项填写!不得增删拆分!

这是最常见、最严重的错误。Agent经常自作主张把一个检查点拆成多个、合并多个检查点为一个、或自行新增检查点,导致编号和框架完全对不上。

严格规则:

  1. 编号必须1-69连续,不得跳号、重号、自编编号(如4.1/4.2不属于框架)
  2. 检查项名称必须使用 framework.md 中"关注要点"列的原文,不得自行简写或改写
  3. 总数必须恰好69项:合规尽调51项 + 项目效能12项 + 组织生态4项 + 舆情2项
  4. 不得自行新增检查点(如"信息公开及时性""受益人数统计"等不属于框架)
  5. 不得将一个检查点拆成多行(如检查点1不能拆成3行"法人登记""税前扣除""公募资格")
  6. 表格列数必须7列:序号 | 检查项 | 查询结果 | 数据来源 | 合规判断/效能评级 | 判断依据 | 备注

填写前先核对:打开 references/framework.md,逐行确认当前检查点的序号、关注要点、具体内容,严格对应填写。

每个检查点必须包含:查询结果、数据来源、合规性判断/效能评级、判断依据、备注。

填写数据时从以下来源按优先级取:

| 优先级 | 数据来源 | 说明 | |--------|---------|------| | 0 | 第0步Body.js提取的slideset图片OCR结果和PDF年报数据 | wezhan网站最新最全数据,包含2025-2026年 | | 1 | 第0步发现的慈善中国数据 | 政府官方数据 | | 2 | 第1步读取的静态页面内容 | 完整的原始数据(⚠️可能只到2024年2月) | | 3 | 第2步动态内容的替代方案 | site:搜索/sitemap/分页URL | | 4 | 第3步搜索的其他来源 | 微信公众号、企查查等 |

🔴🔴🔴 金额数据必须与原始来源精确一致,不得用预算数代替实际数!

常见金额错误:

  • 把"预算金额"当成"实际支出金额"写入报告(如某项目预算262万但实际支出127万,应写实际支出127万)
  • 捐赠收入和公益支出混在同一个表里(应分表呈现)
  • 金额四舍五入丢失精度(应保留原始精确数字,如3,654,756.13而非"约365万")
  • slideset OCR识别的金额不完整(必须OCR全部图片后汇总,不能只列几笔就停)
  • 多笔金额合并写成"440,000+220,000"(应每笔单独一行,逐条列出)
  • 混合使用"万元"和"元"单位(同一表格内必须统一单位,建议统一用"元")
  • 年度对比数据部分标"待核实"但实际可从已有来源获取(优先用已有的年报/newsinfo/slideset数据填入,实在没有才标"待核实")

🔴 关键规则:检查点40/41(公益支出比例、管理费用比例)必须使用Body.js/PDF中的实际数字,不能只用间接推理。如果同时有间接证据和直接数据,两者都要写,但合规判断必须基于直接数据。

🔴🔴🔴 检查点40(公益支出比例)法规适用——极易混淆,必须仔细区分!

| 组织类型 | 公益支出计算基数 | 法规依据 | |---------|--------------|---------| | 公募基金会 | 上年度总收入 | 《慈善法》第60条 | | 非公募基金会 | 上年末净资产 | 《关于慈善组织开展慈善活动年度支出和管理费用的规定》(民发〔2016〕214号) | | 2026年新规(净资产<400万) | 上年末净资产,≥8% | 民发〔2026〕12号 |

常见错误:把非公募基金会的公益支出算成"占上年度总收入的比例"——这是公募基金会的算法!

正确算法示例(非公募基金会)

  • 2023年末净资产:2,047,023.75元
  • 2024年慈善活动支出:3,654,756.13元
  • 公益支出比例 = 3,654,756.13 ÷ 2,047,023.75 = 178.54%(远超8%要求)✅

错误算法示例

  • 2023年总收入:6,629,977.62元
  • 公益支出比例 = 3,654,756.13 ÷ 6,629,977.62 = 55.13% ❌(这是公募基金会的算法,非公募不能用)

🔴🔴🔴 检查点41(管理费用比例)法规适用:

  • 管理费用比例 = 管理费用 ÷ 当年总支出
  • 2026年新规:净资产<6000万的非公募基金会,管理费用≤12%
  • 旧规:管理费用≤10%
  • 无论用哪个标准,5.15%都远低于上限

⚠️ 填写检查点40/41时,必须同时给出:

  1. 基金会类型(公募/非公募)→ 决定用哪个计算基数
  2. 计算基数(上年末净资产金额 或 上年度总收入金额)
  3. 实际支出金额
  4. 计算得出的比例
  5. 法规要求的最低/最高比例
  6. 合规判断

第5步:生成报告与文件

  1. 输出完整报告正文到对话
  2. 生成Word和PDF文件供下载

报告必须包含的章节(按顺序):

  1. 基本信息表:基金会名称、统一社会信用代码、登记管理机关、法定代表人、成立时间、注册资金、业务范围、公募资格、官网地址、联系电话、发起方、党员人数/党建情况
  2. 合规尽调(模块1-6,检查点1-51)
  3. 项目效能尽调(模块7-9,检查点52-63)
  4. 组织生态评估(检查点64-67)
  5. 舆情(检查点68-69)
  6. 财务数据汇总附录(含slideset OCR最新数据)
  7. 统计表(合规性51项 + 项目效能 + 组织生态舆情)
  8. 综合评价(200-400字)
  9. 疑点与风险提示:必须包含党员/党建情况、管理层关联等治理细节,不得遗漏年报中已有的信息
  10. 风险提示
  11. 改进建议
  12. 编制依据(所有数据来源URL)

🔴 报告数据呈现原则:

  1. 以调查时间点为基准,展示最新数据:报告是2026年5月做的调查,财务数据汇总不应只写"2024年度",应该标注"截至2026年5月"或"最新可得数据"
  2. 最新数据优先呈现:slideset OCR中的2025-2026年数据放在最前面,2024年年报数据作为历史对比辅助
  3. 禁止只用年报年度做标题:不能写"财务数据汇总(2024年度)"然后里面又包含2025-2026数据,标题和数据必须一致
  4. 数据时间范围必须明确标注:每个数据来源都要写清楚时间范围(如"截至2026年4月""2024年度")
  5. 推荐标题格式财务数据汇总(截至{调查月份}最新可得数据)
  6. 🔴 项目支出优先用最新年度:检查点55(各类型项目支出金额统计)等涉及项目数据时,应优先呈现slideset OCR中2025-2026年最新年度的支出明细和分类,2024年年报数据作为历史对比。不得只写2024年年报数据而忽略更新的slideset数据

🔴🔴🔴 slideset OCR数据必须融入财务数据汇总表!

已反复出现的问题:Agent虽然执行了slideset图片OCR并在个别检查点(如33/37/65)引用了OCR结果,但财务数据汇总表里只有2024年年报数据,2025-2026年的slideset OCR数据(捐赠约152万、2026年1-4月支出约86.5万等)完全没出现在汇总中。

必须做到:

  • 财务数据汇总表必须包含slideset OCR提取到的所有年度数据,不能只有PDF年报覆盖的年度
  • 如果slideset OCR识别到了2025年捐赠和2026年支出,汇总表必须体现这些数据,哪怕只是"截至2026年4月累计XXX"
  • slideset OCR结果和PDF年报数据是互补关系,两者都必须出现在汇总表中

合规性判断标准

详细判断标准见 references/evaluation-criteria.md

合规尽调(检查点1-51)

  • ✅符合:有明确证据表明合规
  • ⚠️待核实:信息不完整或存在疑点
  • ❌不符合:有明确证据表明不合规
  • ➖不适用:该检查点对该组织不适用

项目效能、组织生态、舆情(检查点52-69)

  • 🟢优秀 / 🟡良好 / 🟠一般 / 🔴不足

调查框架

完整调查框架见 references/framework.md

输出格式

详细输出模板见 references/report-template.md

检查项命名规则

检查项名称直接使用 framework.md 中对应检查点的"关注要点"列内容,不得自行编造或简写。同一模块内关注要点已确保不重复。

🔴 严格编号对齐:报告中检查点的序号必须与 framework.md 完全一致(1-69),不得跳号、重号、增删或自编编号(如4.1/4.2等不属于框架)。

文件排版规则

  • 表格7列:序号、检查项、查询结果、数据来源、合规判断/效能评级、判断依据、备注
  • 查询结果每80-100字换行
  • 每张表格不超过15行
  • 每个模块之间留空行和分隔线

报告末尾附加

  1. 合规性统计表(51项)
  2. 项目效能统计表(12项)
  3. 组织生态与舆情统计表(6项)
  4. 综合评价(200-400字)
  5. 风险提示
  6. 改进建议
  7. 编制依据(所有数据来源URL)

工具调用优化策略

为了在操作次数限制内完成全部调查任务:

  • 第0步花3-5次调用,但能避免后续10+次重复搜索
  • 每次搜索尽量覆盖多个检查点(组合关键词)
  • site:搜索发现的静态页通常能覆盖5-10个检查点
  • 同一来源只读一次,数据记下来后续引用

关键禁止事项

  • 禁止暴露内部调用参数
  • 禁止生成空内容文件
  • 禁止在查询结果为空时标"✅符合"
  • 禁止编造信息
  • 禁止只输出正文不生成文件
  • 禁止跳过第0步直接填检查点
  • 禁止发现栏目内容为空时不尝试site:搜索就放弃
  • 禁止只看官网第一页就标注"数据完整"
  • 🔴 禁止检测到wezhan CMS后不执行0.2.2和0.2.3步骤 — 这是最常见的失败原因!即使site:搜索已找到静态页数据或PDF年报已下载,也必须执行Body.js slideset图片OCR,因为PDF年报只有到2024年的数据,slideset图片才有2025-2026年最新数据
  • 🔴 禁止用间接推理(如"政策逻辑验证法")代替Body.js/PDF中的实际数字 — 间接推理只能作为辅助证据,不能替代真实财务数据。例如:不能仅凭"连续获得税前扣除资格"就标✅,必须同时给出从PDF年报中提取的实际净资产、公益支出比例、管理费用比例等数字
  • 🔴 禁止把site:搜索找到的旧数据当成完整数据 — newsinfo静态页可能只到2024年2月,最新数据在Body.js slideset图片和PDF年报中
  • 🔴 禁止只提取slideset前几张旧图片就停 — 必须用grep提取全部background-image URL,编号最大的图片往往是最新的2025-2026年数据,漏掉就是数据不完整
  • 🔴 禁止用不带Referer头的方式下载Body.js和PDF — 直接用网页读取工具访问wezhan CDN会403 Forbidden,必须使用能设置Referer头的方式。拿到403就放弃是严重错误
  • 🔴 禁止写"由于网络代理限制,无法下载PDF"就放弃 — 这不是不可克服的问题!403只是因为缺少Referer头。如果一种下载方式不行,必须换另一种方式重试(如换一种能设置请求头的工具),绝对不能直接放弃0.2.2和0.2.3步骤
  • 🔴 禁止在检查点40/41写"用户提供数据" — Skill必须自己获取数据,不能依赖用户提供。如果PDF年报数据确实无法获取,应标注⚠️待核实,而不是用"用户提供数据"

约束

  • 只调查合法登记的基金会/社会组织
  • 查询结果仅供参考,不作为最终决策依据
  • 发现重大违规行为时主动醒目提示
  • 搜索结果矛盾时列出不同来源供用户判断
  • 必须一次完成全部69个检查点
  • 必须输出Word和PDF文件