Foundation Due Diligence Skill

Description

对慈善基金会/社会组织进行全面尽职调查的技能。输入任意基金会名称，自动全网搜索真实信息，按照4大调查领域、11个模块、69个检查点框架生成结构化报告，输出Word和PDF文件。

作者信息

作者：user_26b924d6
版本：3.7.1

Skill 能力说明

本技能用于对中国境内合法登记的慈善基金会/社会组织进行全面尽职调查，涵盖以下4大领域：

合规尽调（6个模块，51个检查点）：组织资格、组织架构、项目合规、财务合规、信息公开、诉讼仲裁
项目效能尽调（3个模块，12个检查点）：项目概况、成本效益分析、可持续性与规模化潜力
组织生态评估（4个检查点）：核心竞争力、行业公信力、资源链接力、政策影响力
舆情调查（2个检查点）：媒体曝光、公众投诉

适用场景

对拟合作的慈善基金会进行合规尽调
评估基金会的项目执行效能和社会影响力
审查基金会的信息公开和财务透明度
对基金会进行舆情监测和风险排查
为捐赠决策提供依据

输入

用户输入基金会/社会组织的名称（如"鄂尔多斯市聚祥公益基金会"）。

输出

完整的尽职调查报告（Markdown格式，包含全部69个检查点的详细内容）
Word文件（可供下载）
PDF文件（可供下载）

核心原则

必须搜索：每个检查点都必须调用搜索插件查询，严禁留空或写"暂无数据"
有数据才能判断：没有搜索到信息 → 标"⚠️待核实"，绝不能默认标"✅符合"
禁止编造：所有信息必须来自搜索结果
来源必须标注：每个检查点必须写明数据来自哪个网站和URL
查询结果要详细全面：不要只写一句话概括
交叉验证：关键信息至少从2个来源交叉验证

🔴🔴🔴 执行流程（严格按顺序，不可跳步）🔴🔴🔴

第0步：发现所有可用数据入口（必须首先完成，否则后续必缺数据）

这是最关键的一步。 90%的"查不到数据"问题都是因为跳过了这一步直接去填检查点。

0.1 搜索慈善中国

搜索 "[组织名] 慈善中国" → 找到组织详情页URL → 用链接读取插件访问

记录以下信息：

统一社会信用代码、法定代表人、注册资金、成立日期
业务主管单位、登记管理机关
年度工作报告（最近3年）
募捐方案备案
信息公开情况

0.2 搜索官网并发现全站静态页面

搜索 "[组织名] 官网" → 找到官网首页URL

然后立即用链接读取插件访问以下URL（按顺序试，哪个能用就用哪个）：

https://[官网域名]/sitemap.xml
https://[官网域名]/robots.txt    ← robots.txt里可能有Sitemap行
https://[官网域名]/sitemap.txt
https://[官网域名]/sitemap.html

sitemap是金矿：它会列出网站所有被承认的页面URL。从中提取：

包含"年报""审计""财务""捐赠""公示""章程""制度""理事"的URL → 高优先级
包含"项目""活动""新闻"的URL → 中优先级

0.2.1 检测是否为万网/中企动力(wezhan.cn)建站（关键！）

访问官网首页或信息公开页时，检查页面源码是否包含以下特征：

Body.js （页面内容通过此JS注入）
img.wanwang.xin （万网CDN域名）
wezhan 或 中企动力
slideset （分页数据组件）

如果检测到以上任意特征 → 必须立即执行0.2.2和0.2.3，不可跳过！

已知的wezhan特征Body.js URL模式：

https://img.wanwang.xin/pubsf/{siteId前5位}/{siteId}/cdn-static-pages/pages/pc/{pageId}_zh-cn.html.Body.js?version=xxx

0.2.2 🔴🔴🔴 提取Body.js中的slideset图片并OCR（wezhan网站强制执行）

⚠️ 这不是可选步骤！只要0.2.1检测到wezhan特征，就必须执行本步骤。即使PDF年报已经下载，也必须执行本步骤，因为：

PDF年报最晚只到2024年（年报有编制周期，永远滞后）
slideset图片包含最新到2026年的捐赠/支出明细，是PDF年报无法覆盖的
site:搜索找到的newsinfo静态页数据可能只到2024年2月，也不是最新的
PDF和slideset图片是互补的，缺一不可！PDF提供权威财务汇总数据，slideset图片提供最新捐赠/支出明细

🔴 已发生的真实错误：Agent下载了PDF年报后就跳过了slideset图片OCR，导致报告只体现到2024年数据，而官网实际上已更新到2026年。这是完全不可接受的。

执行步骤（必须完整执行，缺一不可）：

Step A：从页面源码提取Body.js URL

用链接读取或fetch_web访问目标页面（信息公开页优先），在HTML源码中搜索 Body.js，找到完整URL。

Step B：获取Body.js内容

🔴🔴🔴 关键注意：直接用网页读取工具（如fetch_web）访问Body.js URL会返回403 Forbidden！

你必须找到一种能设置HTTP Referer头的下载方式。Referer头的值必须为目标页面URL（如 https://www.jxfoundation.com/xxgk11），不能为空。

如果你用网页读取工具拿到了403，不要放弃！ 403只是因为缺少Referer头，不是真的无法访问。换一种能设置请求头的方式重试。

已发生的真实错误：Agent用网页读取工具访问Body.js得到403，就写了"Body.js状态：403 Forbidden，无法提取"或"由于网络代理限制，无法下载"，然后放弃了slideset图片OCR和PDF下载，导致2025-2026年最新数据全部丢失。完全错误！只要能设置Referer头就一定能下载成功。

Step C：从Body.js中提取slideset图片URL

在Body.js内容中搜索 slideset，找到所有 ctype="slideset" 的组件。在每个slideset组件内搜索 content-box-inner，提取所有 background-image:url(//xxx) 中的图片URL。

图片URL格式：//img.wanwang.xin/contents/sitefiles2050/{siteId}/images/{imageId}.png 或 .jpg

识别哪个slideset对应哪个栏目：slideset组件通常紧跟在栏目标题（如"捐赠收入""公益支出"）后面，根据上下文位置判断。图片编号越大通常数据越新。

🔴🔴🔴 必须提取每个slideset组件下的全部图片！常见错误：只提取了前2-3张旧图片就停了，漏掉了编号最大的最新图片。

聚祥基金会实测示例：

捐赠收入slideset有3张图：48779324.png（2020-2023旧数据）、175846051.jpg（2024-2025新数据）、176026104.jpg（2026年3-4月最新数据）
公益支出slideset有8张图：前6张是2020-2024旧数据，最后2张174451511.png（2025年7-8月）和176026132.jpg（2026年1-4月）是最新数据
如果只提取了前几张，就会漏掉2025-2026年的最新数据，导致报告只体现到2024年

提取技巧：在Body.js文本中搜索所有 background-image:url( 出现的位置，逐一提取URL，确保不遗漏。

Step D：下载图片

🔴 同Body.js，图片下载也需要设置Referer头，否则可能403。Referer头的值为官网页面URL。

Step E：OCR识别图片

使用图片识别/OCR工具读取每张下载的图片，提取表格数据。重点提取：

捐赠收入明细（捐赠方、金额、日期）
公益支出明细（资助对象、金额、日期）
年检年审数据

🔴 建议按图片编号从大到小OCR，优先识别最新数据。 如果时间有限，至少要OCR编号最大的2-3张图片（这些是最新数据），旧图片可以跳过（因为旧数据通常已被site:搜索的静态页覆盖）。

0.2.3 🔴🔴🔴 下载Body.js中的PDF报告（wezhan网站强制执行）

⚠️ 同样是强制步骤！PDF年度工作报告包含最权威的财务数据（净资产、公益支出比例、管理费用等）。

执行步骤：

Step A：在Body.js内容中搜索 filedownload

提取所有 /filedownload/{数字ID} 模式的链接。

Step B：逐个下载PDF

🔴 同Body.js，PDF下载也需要设置Referer头，否则会403。Referer头的值为官网页面URL。

⚠️ 如果不确定哪个ID对应哪个文件，先下载前10个ID，读取标题页来识别，找到年度工作报告后再重点解析。

Step C：识别PDF内容

用PDF解析工具读取每个PDF的标题页，识别它是：

年度工作报告（最重要！含净资产、公益支出、管理费用等全部财务数据）
审计报告
专项信息审核报告
章程
其他制度文件

重点提取年度工作报告中的数据：

年末净资产合计
慈善活动支出金额及占上年末净资产比例
管理费用金额及占总支出比例
捐赠收入总额
各公益项目支出明细

如果不确定哪个ID对应哪个文件：先下载前10个ID，读取标题页来识别，找到年度工作报告后再重点解析。

0.3 用site:搜索发现深层静态页面

每个关键词必须单独搜索一次（不要组合，单独搜发现更多）：

| 搜索词 | 目的 | |--------|------| | site:[官网域名] 捐赠 | 找捐赠收入/支出页面 | | site:[官网域名] 年报 | 找年报页面 | | site:[官网域名] 审计 | 找审计报告页面 | | site:[官网域名] 财务 | 找财务数据页面 | | site:[官网域名] 章程 | 找章程页面 | | site:[官网域名] 制度 | 找管理制度页面 | | site:[官网域名] 项目 | 找项目信息页面 | | site:[官网域名] 理事 | 找理事会信息页面 |

关键发现：很多基金会的newsinfo/detail详情页是纯静态的，包含完整数据。这些页面在官网导航里看不到（因为导航指向的是动态列表页），但site:搜索能找到。

0.4 整理可用数据源清单

完成0.1-0.3后，你应该有了一份清单：

| 数据源类型 | URL | 可覆盖的检查点 | 优先级 | |-----------|-----|--------------|--------| | 慈善中国详情页 | ... | 1-7, 22-51 | 最高 | | Body.js中提取的slideset图片OCR结果 | ... | 捐赠收支、理事会、年检年审等 | 最高（wezhan网站） | | Body.js中提取的PDF年度工作报告 | ... | 40-41（公益支出比例、管理费用）及全部财务数据 | 最高（wezhan网站） | | 官网sitemap中的静态页 | ... | 各检查点 | 高 | | site:搜索发现的静态页 | ... | 各检查点（⚠️注意：可能不是最新数据） | 中 |

⚠️ 重要提醒：

site:搜索找到的newsinfo静态页数据可能只到2024年2月，不是最新的
Body.js中的slideset图片和PDF报告才包含2025-2026年最新数据
检查点40/41（公益支出比例、管理费用比例）必须用Body.js/PDF中的实际数字核实，不能用间接推理代替

特别标注：如果检测到wezhan.cn建站，必须单独列出Body.js URL、提取到的slideset图片URL清单、以及所有filedownload ID清单。

没有这份清单就不许往下走。

第1步：读取高优先级静态页面

从第0步的清单中，按优先级读取页面内容：

优先级0：Body.js提取的slideset图片OCR结果和PDF年度工作报告（wezhan网站独有，最新最全数据） 优先级1：慈善中国详情页（政府数据，最权威） 优先级2：site:搜索发现的newsinfo/detail静态页（⚠️可能不是最新数据，需要与Body.js数据对比时间范围） 优先级3：sitemap中发现的高优先级URL 优先级4：官网首页（只能看到导航结构和图片链接）

读取每个页面时：

如果页面内容是文字 → 直接提取数据
如果页面内容是图片 → 记录图片URL，后续OCR识别
如果页面显示PDF文件名但无下载链接 → 记录文件名，用site:搜索找PDF直接链接
如果页面某个栏目内容为空（如"捐赠收入"下方空白） → 这是动态加载的内容，必须按第2步处理

第2步：处理动态/空白内容（遇到空内容时执行）

⚠️ 注意：如果你是wezhan网站，Body.js方案已在0.2.2强制执行过，本步骤仅处理其他类型的动态内容。

当你访问一个页面，发现某个栏目（如"捐赠收入""公益支出"）下方内容为空或只显示部分数据，说明这是动态加载/分页内容。

遇到这种情况，必须按以下顺序尝试，不能跳过：

方法1：site:搜索找静态替代页

搜索 site:[官网域名] [空白栏目关键词]

示例：如果你发现"捐赠收入"栏目为空，搜索 site:jxfoundation.com 捐赠

原理：很多网站的列表页是动态的，但具体的详情页（newsinfo/detail页面）是静态的。搜索引擎已经收录了这些静态页，site:搜索能直接找到。

实测证明：聚祥基金会官网的"捐赠收入"栏目是动态加载的，但 site:jxfoundation.com 捐赠 能搜到 newsinfo/2026755.html 这个静态页，包含从2020年到2024年2月的捐赠收支数据。但注意：静态页可能不是最新的，最新数据需用方法0获取。

方法2：sitemap中找替代URL

回看第0步收集的sitemap，找出与空白栏目相关的URL，直接用链接读取插件访问。

方法3：直接请求分页URL

在原URL后追加常见分页参数，用链接读取插件逐个尝试：

原URL?page=2
原URL&page=2
原URL_2.html
原URL?pageNo=2
原URL?currentPage=2
原URL?p=2
原URL/2.html

至少尝试3种模式。

方法4：找后台API

从页面HTML源码搜索 api ajax json fetch getList 等关键词，找到API地址后直接请求。

方法5：OCR识别当前页面可见图片

如果页面上有图片（如理事会名单、年报截图、基本信息图片等），用OCR/图片识别工具读取内容。

对于非wezhan网站的图片型数据，直接记录图片URL并用OCR识别即可。

方法6：诚实标注

如果以上方法都无法获取完整数据，必须标注：

"该数据来自动态分页内容，本次调查已获取截至XXXX的数据。建议：1）访问慈善中国查看完整年报；2）人工访问官网翻页核实。"

绝对禁止：假装数据完整、标"✅符合"但实际只看了第一页、不尝试就放弃。

第3步：搜索其他数据源

"[组织名] 微信公众号" → 获取组织动态、活动信息
"[发起方企业名] 企查查" → 发起方公司信息
"[组织名] 行政处罚诉讼" → 法律风险
"[组织名] 年度审计报告" → 财务数据
"[组织名] 年报财务" → 补充财务
"[组织名] 负面违规" → 负面信息
"[组织名] 新闻媒体报道" → 媒体报道
按需补充搜索

第4步：填写69个检查点

🔴🔴🔴 必须严格按照 framework.md 的69个检查点逐项填写！不得增删拆分！

这是最常见、最严重的错误。Agent经常自作主张把一个检查点拆成多个、合并多个检查点为一个、或自行新增检查点，导致编号和框架完全对不上。

严格规则：

编号必须1-69连续，不得跳号、重号、自编编号（如4.1/4.2不属于框架）
检查项名称必须使用 framework.md 中"关注要点"列的原文，不得自行简写或改写
总数必须恰好69项：合规尽调51项 + 项目效能12项 + 组织生态4项 + 舆情2项
不得自行新增检查点（如"信息公开及时性""受益人数统计"等不属于框架）
不得将一个检查点拆成多行（如检查点1不能拆成3行"法人登记""税前扣除""公募资格"）
表格列数必须7列：序号 | 检查项 | 查询结果 | 数据来源 | 合规判断/效能评级 | 判断依据 | 备注

填写前先核对：打开 references/framework.md，逐行确认当前检查点的序号、关注要点、具体内容，严格对应填写。

每个检查点必须包含：查询结果、数据来源、合规性判断/效能评级、判断依据、备注。

填写数据时从以下来源按优先级取：

| 优先级 | 数据来源 | 说明 | |--------|---------|------| | 0 | 第0步Body.js提取的slideset图片OCR结果和PDF年报数据 | wezhan网站最新最全数据，包含2025-2026年 | | 1 | 第0步发现的慈善中国数据 | 政府官方数据 | | 2 | 第1步读取的静态页面内容 | 完整的原始数据（⚠️可能只到2024年2月） | | 3 | 第2步动态内容的替代方案 | site:搜索/sitemap/分页URL | | 4 | 第3步搜索的其他来源 | 微信公众号、企查查等 |

🔴🔴🔴 金额数据必须与原始来源精确一致，不得用预算数代替实际数！

常见金额错误：

把"预算金额"当成"实际支出金额"写入报告（如某项目预算262万但实际支出127万，应写实际支出127万）
捐赠收入和公益支出混在同一个表里（应分表呈现）
金额四舍五入丢失精度（应保留原始精确数字，如3,654,756.13而非"约365万"）
slideset OCR识别的金额不完整（必须OCR全部图片后汇总，不能只列几笔就停）
多笔金额合并写成"440,000+220,000"（应每笔单独一行，逐条列出）
混合使用"万元"和"元"单位（同一表格内必须统一单位，建议统一用"元"）
年度对比数据部分标"待核实"但实际可从已有来源获取（优先用已有的年报/newsinfo/slideset数据填入，实在没有才标"待核实"）

🔴 关键规则：检查点40/41（公益支出比例、管理费用比例）必须使用Body.js/PDF中的实际数字，不能只用间接推理。如果同时有间接证据和直接数据，两者都要写，但合规判断必须基于直接数据。

🔴🔴🔴 检查点40（公益支出比例）法规适用——极易混淆，必须仔细区分！

| 组织类型 | 公益支出计算基数 | 法规依据 | |---------|--------------|---------| | 公募基金会 | 上年度总收入 | 《慈善法》第60条 | | 非公募基金会 | 上年末净资产 | 《关于慈善组织开展慈善活动年度支出和管理费用的规定》(民发〔2016〕214号) | | 2026年新规（净资产<400万） | 上年末净资产，≥8% | 民发〔2026〕12号 |

常见错误：把非公募基金会的公益支出算成"占上年度总收入的比例"——这是公募基金会的算法！

正确算法示例（非公募基金会）：

2023年末净资产：2,047,023.75元
2024年慈善活动支出：3,654,756.13元
公益支出比例 = 3,654,756.13 ÷ 2,047,023.75 = 178.54%（远超8%要求）✅

错误算法示例：

2023年总收入：6,629,977.62元
公益支出比例 = 3,654,756.13 ÷ 6,629,977.62 = 55.13% ❌（这是公募基金会的算法，非公募不能用）

🔴🔴🔴 检查点41（管理费用比例）法规适用：

管理费用比例 = 管理费用 ÷ 当年总支出
2026年新规：净资产<6000万的非公募基金会，管理费用≤12%
旧规：管理费用≤10%
无论用哪个标准，5.15%都远低于上限

⚠️ 填写检查点40/41时，必须同时给出：

基金会类型（公募/非公募）→ 决定用哪个计算基数
计算基数（上年末净资产金额或上年度总收入金额）
实际支出金额
计算得出的比例
法规要求的最低/最高比例
合规判断

第5步：生成报告与文件

输出完整报告正文到对话
生成Word和PDF文件供下载

报告必须包含的章节（按顺序）：

基本信息表：基金会名称、统一社会信用代码、登记管理机关、法定代表人、成立时间、注册资金、业务范围、公募资格、官网地址、联系电话、发起方、党员人数/党建情况
合规尽调（模块1-6，检查点1-51）
项目效能尽调（模块7-9，检查点52-63）
组织生态评估（检查点64-67）
舆情（检查点68-69）
财务数据汇总附录（含slideset OCR最新数据）
统计表（合规性51项 + 项目效能 + 组织生态舆情）
综合评价（200-400字）
疑点与风险提示：必须包含党员/党建情况、管理层关联等治理细节，不得遗漏年报中已有的信息
风险提示
改进建议
编制依据（所有数据来源URL）

🔴 报告数据呈现原则：

以调查时间点为基准，展示最新数据：报告是2026年5月做的调查，财务数据汇总不应只写"2024年度"，应该标注"截至2026年5月"或"最新可得数据"
最新数据优先呈现：slideset OCR中的2025-2026年数据放在最前面，2024年年报数据作为历史对比辅助
禁止只用年报年度做标题：不能写"财务数据汇总（2024年度）"然后里面又包含2025-2026数据，标题和数据必须一致
数据时间范围必须明确标注：每个数据来源都要写清楚时间范围（如"截至2026年4月""2024年度"）
推荐标题格式：财务数据汇总（截至{调查月份}最新可得数据）
🔴 项目支出优先用最新年度：检查点55（各类型项目支出金额统计）等涉及项目数据时，应优先呈现slideset OCR中2025-2026年最新年度的支出明细和分类，2024年年报数据作为历史对比。不得只写2024年年报数据而忽略更新的slideset数据

🔴🔴🔴 slideset OCR数据必须融入财务数据汇总表！

已反复出现的问题：Agent虽然执行了slideset图片OCR并在个别检查点（如33/37/65）引用了OCR结果，但财务数据汇总表里只有2024年年报数据，2025-2026年的slideset OCR数据（捐赠约152万、2026年1-4月支出约86.5万等）完全没出现在汇总中。

必须做到：

财务数据汇总表必须包含slideset OCR提取到的所有年度数据，不能只有PDF年报覆盖的年度
如果slideset OCR识别到了2025年捐赠和2026年支出，汇总表必须体现这些数据，哪怕只是"截至2026年4月累计XXX"
slideset OCR结果和PDF年报数据是互补关系，两者都必须出现在汇总表中

合规性判断标准

详细判断标准见 references/evaluation-criteria.md

合规尽调（检查点1-51）

✅符合：有明确证据表明合规
⚠️待核实：信息不完整或存在疑点
❌不符合：有明确证据表明不合规
➖不适用：该检查点对该组织不适用

项目效能、组织生态、舆情（检查点52-69）

🟢优秀 / 🟡良好 / 🟠一般 / 🔴不足

调查框架

完整调查框架见 references/framework.md

输出格式

详细输出模板见 references/report-template.md

检查项命名规则

检查项名称直接使用 framework.md 中对应检查点的"关注要点"列内容，不得自行编造或简写。同一模块内关注要点已确保不重复。

🔴 严格编号对齐：报告中检查点的序号必须与 framework.md 完全一致（1-69），不得跳号、重号、增删或自编编号（如4.1/4.2等不属于框架）。

文件排版规则

表格7列：序号、检查项、查询结果、数据来源、合规判断/效能评级、判断依据、备注
查询结果每80-100字换行
每张表格不超过15行
每个模块之间留空行和分隔线

报告末尾附加

合规性统计表（51项）
项目效能统计表（12项）
组织生态与舆情统计表（6项）
综合评价（200-400字）
风险提示
改进建议
编制依据（所有数据来源URL）

工具调用优化策略

为了在操作次数限制内完成全部调查任务：

第0步花3-5次调用，但能避免后续10+次重复搜索
每次搜索尽量覆盖多个检查点（组合关键词）
site:搜索发现的静态页通常能覆盖5-10个检查点
同一来源只读一次，数据记下来后续引用

关键禁止事项

禁止暴露内部调用参数
禁止生成空内容文件
禁止在查询结果为空时标"✅符合"
禁止编造信息
禁止只输出正文不生成文件
禁止跳过第0步直接填检查点
禁止发现栏目内容为空时不尝试site:搜索就放弃
禁止只看官网第一页就标注"数据完整"
🔴 禁止检测到wezhan CMS后不执行0.2.2和0.2.3步骤 — 这是最常见的失败原因！即使site:搜索已找到静态页数据或PDF年报已下载，也必须执行Body.js slideset图片OCR，因为PDF年报只有到2024年的数据，slideset图片才有2025-2026年最新数据
🔴 禁止用间接推理（如"政策逻辑验证法"）代替Body.js/PDF中的实际数字 — 间接推理只能作为辅助证据，不能替代真实财务数据。例如：不能仅凭"连续获得税前扣除资格"就标✅，必须同时给出从PDF年报中提取的实际净资产、公益支出比例、管理费用比例等数字
🔴 禁止把site:搜索找到的旧数据当成完整数据 — newsinfo静态页可能只到2024年2月，最新数据在Body.js slideset图片和PDF年报中
🔴 禁止只提取slideset前几张旧图片就停 — 必须用grep提取全部background-image URL，编号最大的图片往往是最新的2025-2026年数据，漏掉就是数据不完整
🔴 禁止用不带Referer头的方式下载Body.js和PDF — 直接用网页读取工具访问wezhan CDN会403 Forbidden，必须使用能设置Referer头的方式。拿到403就放弃是严重错误
🔴 禁止写"由于网络代理限制，无法下载PDF"就放弃 — 这不是不可克服的问题！403只是因为缺少Referer头。如果一种下载方式不行，必须换另一种方式重试（如换一种能设置请求头的工具），绝对不能直接放弃0.2.2和0.2.3步骤
🔴 禁止在检查点40/41写"用户提供数据" — Skill必须自己获取数据，不能依赖用户提供。如果PDF年报数据确实无法获取，应标注⚠️待核实，而不是用"用户提供数据"

约束

只调查合法登记的基金会/社会组织
查询结果仅供参考，不作为最终决策依据
发现重大违规行为时主动醒目提示
搜索结果矛盾时列出不同来源供用户判断
必须一次完成全部69个检查点
必须输出Word和PDF文件