SKILL.md — 报表数据分析（v3.0）

版本记录：v1.0（首次试跑）→ v1.1（增加 Markdown 表格支持 + 质量校验清单）→ v1.2（增加多维交叉分析 + 描述性统计）→ v2.0（三重复合异常检测 + 报表类型映射表 + 考勤/财务主题适配）→ v3.0（列名参数化映射 + 质量自检机制嵌入执行流程 + 标准差法假设说明 + 结构化 custom_calibration + TestBench 脚本）

一、核心价值主张

本 Skill 将日常业务报表（销售/费用/考勤/用车等）的分析工作，从"每次手动看表"升级为"一键标准化报告输出"，核心解决以下问题：

| 问题 | 解决方案 | |------|---------| | 异常靠肉眼找，容易遗漏 | 三重复合异常检测（阈值法 + 标准差法 + 突变检测）自动标红 | | 不同主题报表格式不同 | 列名自动识别 + 参数化映射表，兼容任意列名 | | 报告结构不统一，质量参差不齐 | 六章节强制规范 + 质量自检 Checklist | | 异常原因靠猜，建议不落地 | 数据驱动原因猜想 + 具体可执行建议（负责人 + 时限） | | 换报表主题后异常维度不匹配 | 报表类型 → 异常维度映射表覆盖运营/财务/行政三大主题 |

二、输入字段标准对照表（column_mapping 参考）

v3.0 核心改进：不再硬编码列名，改为列名自动识别 + 显式参数化映射双轨机制。优先使用 column_mapping 参数显式声明；若未声明则按关键词模糊匹配。

2.1 运营主题（report_theme = 运营）

| 标准字段 | 自动识别关键词 | 说明 | |---------|-------------|------| | date_col | 日期、时间、period、周期 | 时间维度 | | region_col | 区域、大区、省份、城市 | 空间维度 | | product_col | 产品、产品线、类型、category | 产品维度 | | metric_col | 销售额、收入、金额、元、万 | 核心数值（默认分析对象） | | yoy_col | 同比、YoY、yoy、同比增长 | 同比增长率列（数值格式，支持小数或百分比） | | qoq_col | 环比、QoQ、qoq、上期 | 环比增长率列 | | plan_col | 计划、目标、预算、target | 计划销售额列 | | deviation_col | 偏差、deviation、差异、超计划 | 偏差率列（正=超计划，负=低于计划） | | quantity_col | 数量、单、笔、件、人次 | 销售数量列（用于描述性统计） |

2.2 财务主题（report_theme = 财务）

| 标准字段 | 自动识别关键词 | 说明 | |---------|-------------|------| | date_col | 日期、时间 | 时间维度 | | dept_col | 部门、中心、科室 | 费用归属部门 | | category_col | 类别、科目、项目、type | 费用类型（差旅/办公/招待等） | | amount_col | 费用、报销、支出、金额、元 | 实际报销金额 | | budget_col | 预算、额度、指标 | 预算金额 | | deviation_col | 偏差、超支、节余、deviation | 预算偏差率 | | count_col | 笔、单、人次 | 报销单数量 |

2.3 行政主题（report_theme = 行政）

| 标准字段 | 自动识别关键词 | 说明 | |---------|-------------|------| | date_col | 日期、时间 | 时间维度 | | dept_col | 部门、科室 | 部门维度 | | entity_col | 人员、司机、车牌、物品 | 具体对象（考勤=人员；用车=车辆/司机） | | metric_col | 出勤率、出车率、库存周转 | 核心效率指标 | | target_col | 计划、目标、出勤率目标 | 目标值 | | deviation_col | 偏差、deviation、差异 | 偏差率 | | count_col | 迟到、请假、出车、借用 | 计数型指标（软性参考，不触发异常） |

2.4 列名映射使用示例

场景：用户报表的销售额列叫"实际营收（万元）"，偏差率列叫"执行偏差"，其他列名恰好匹配。

column_mapping = {
  "metric_col": "实际营收（万元）",
  "deviation_col": "执行偏差",
  "yoy_col": "同比增长率"
}

提示：Agent 在执行 Step 1 时，先检查 column_mapping 是否显式传入；若有则直接使用字段映射；若没有则按关键词自动识别；若识别失败则在执行前向用户确认。

三、执行流程（v3.0 完整流程）

Step 0：前置校验（新增 · 质量自检嵌入）

v3.0 核心改进：将质量校验从"事后检查"变为"执行前阻断"，不合格不生成报告，直接报错并给出缺失清单。

0.1 数据基础校验

| 校验项 | 要求 | 不满足时的行为 | |--------|------|--------------| | 数据行数 | ≥ 30 行（不含表头） | quality_check_mode=auto/strict → 报错中止；loose → 生成参考报告并注明数据不足 | | 字段数 | ≥ 5 列 | 同上 | | 对比基准列存在 | 根据 baseline_type 校验对应列是否存在 | 报错并列出缺失列名 | | 列名可识别 | 至少识别出 date_col 和 metric_col | 若 column_mapping 未传且自动识别失败 → 中止并要求用户提供映射表 | | 数值格式 | 指标列和比率列必须为数值型（非文本） | 标注格式异常行，继续执行（loose 模式） |

0.2 质量标准校验（仅在 quality_check_mode=auto/strict 时执行）

| 质量维度 | 具体标准 | 不满足时的处理 | |---------|---------|--------------| | 数据完整性 | 缺失值比例 < 10% | 输出警告，继续执行 | | 异常覆盖性 | 至少存在 1 个真实异常（即至少 1 行满足异常检测条件） | 输出警告，继续执行（防止全部正常导致报告空洞） | | 多维度性 | 至少存在 2 个不同维度（如区域+产品线；部门+月份） | 输出警告，继续执行 | | 时间跨度 | 时间列跨度 ≥ 5 天 | 输出警告，标准差法降级为阈值法 |

校验输出格式（不符合时输出）：

⚠️ 前置校验发现以下问题：
1. [ERROR] 数据行数为 {N} 行，不满足 ≥30 行要求 → 请补充数据
2. [WARN] 对比基准列"同比增长率"未找到 → 请检查 column_mapping 或确认报表格式
3. [INFO] 数据行数不足 20 行，标准差法将降级为阈值法

执行策略：quality_check_mode={mode} → {继续执行 / 中止}

Step 1：数据解析与列名标准化

1.1 格式识别

若 report_data 首行包含逗号（,）且不以 | 开头 → 识别为 CSV
若包含管道符（|）→ 识别为 Markdown 表格
若两种都包含 → 优先 CSV，忽略 Markdown 格式的描述文字

1.2 列名标准化

若 column_mapping 已传入：直接使用映射关系，将原始列名重命名为标准字段名
若未传入：按关键词自动识别（见第二节对照表），识别结果在报告中注明
自动识别失败时：中止执行，要求用户补充 column_mapping

1.3 数据清洗

移除表头行后的纯数据行参与统计
若 metric_col 或 yoy_col 等数值列出现文本值（如"无数据"、"N/A"），标记为缺失值
偏差率计算规则：
- 若已存在 deviation_col：直接使用
- 若无 deviation_col 但有 plan_col：计算 偏差率 = (metric_col - plan_col) / plan_col
- 若既无 deviation_col 也无 plan_col：仅做同比/环比分析，不计算偏差率

v3.0 列名映射表示例（销售报表）：

| 原始列名 | 映射后标准字段 | |---------|--------------| | 日期 | date_col | | 产品线 | product_col | | 区域 | region_col | | 销售额_元 | metric_col | | 销售数量 | quantity_col | | 环比增长率 | qoq_col | | 同比增长率 | yoy_col | | 计划销售额_元 | plan_col | | 偏差率 | deviation_col |

Step 2：描述性统计（工具计算）

v3.0 改进：标准差法增加正态分布假设说明，明确适用条件。

使用 Python 工具对所有数值列计算以下统计量：

| 统计量 | 计算方法 | 说明 | |--------|---------|------| | n | COUNT | 有效数据行数 | | 均值 (μ) | SUM/n | 算术平均数 | | 标准差 (σ) | STDDEV(n) | 衡量数据离散程度 | | 最小值 | MIN | 数据下界 | | 最大值 | MAX | 数据上界 | | μ±2σ 区间 | μ±2σ | 标准差法异常判定区间 |

关于标准差法的正态分布假设说明（v3.0 新增）：

⚠️ 重要前提：标准差法的有效性依赖于数据近似服从正态分布（均值两侧数据大致对称）。若数据严重偏态（如收入分布右偏），标准差法结果可能失准。

不适用标准差法的典型场景：

数据行数 < 20（样本量不足，σ 估计不可靠）

数据存在极端异常值（σ 被异常值放大，导致 μ±2σ 区间过宽，漏检真正的异常）

数据明显非正态分布（如费用报表中少数大额订单拉高均值）

自动降级策略：若数据行数 < std_min_rows（默认 20），自动跳过标准差法，仅使用阈值法；若 std_min_rows 已设置但 < 20，强制使用 20 作为最小值。

替代建议：对于偏态数据，优先使用中位数 ± MAD（绝对离差中位数）法或直接使用阈值法，并注明"数据偏态，标准差法结果仅供参考"。

Step 3：异常检测（三重复合）

v3.0 改进：支持 anomaly_params 参数覆盖默认阈值；明确异常检测优先顺序。

3.1 检测方法一：阈值法（所有主题均适用）

| 异常类型 | 判定条件 | 严重程度 | |---------|---------|---------| | 同比严重下降 | yoy_col ≤ yoy_threshold（默认 -0.30，即 -30%） | 🔴 极严重 | | 偏差率正向极端 | deviation_col ≥ deviation_threshold（默认 +0.30，即 +30%） | 🟠 异常偏高（正向警示） | | 偏差率负向极端 | deviation_col ≤ -deviation_threshold（默认 -0.15，即 -15%） | 🔴 极严重 | | 环比突变暴涨 | qoq_col ≥ mutation_threshold（默认 +0.50，即 +50%） | 🟡 注意（暴涨可能掩盖质量问题） | | 环比突变暴跌 | qoq_col ≤ -mutation_threshold（默认 -0.50，即 -50%） | 🟠 严重（暴跌需立即关注） |

阈值覆盖：通过 anomaly_params 参数可覆盖默认阈值，例如将同比阈值从 -30% 收紧到 -20%。

3.2 检测方法二：标准差法（行数 ≥ std_min_rows 时启用）

计算 metric_col 的均值 μ 和标准差 σ
异常判定：metric_col < μ - std_sigma × σ 或 metric_col > μ + std_sigma × σ （std_sigma 默认值为 2，即 μ±2σ）
正向极端（超出上界）：标记为 ⚠️ 超常表现，不计入负面异常，但作为重要发现单独列出
负向极端（低于下界）：标记为 🔴 极严重异常

3.3 检测方法三：环比突变检测（所有主题均适用）

判定条件：|qoq_col| > mutation_threshold
同时触发阈值法时，优先采用阈值法的严重程度评级

3.4 三种方法的优先级与合并规则

优先级：阈值法 > 标准差法 > 环比突变检测

合并规则：
1. 若同一行同时被阈值法和标准差法检测 → 采用阈值法的严重程度
2. 若同一行同时被阈值法和环比突变检测 → 采用阈值法的严重程度
3. 异常汇总表列出每行触发的所有方法，供读者交叉验证
4. 标准差法正向极端（metric_col > μ + 2σ）→ ⚠️ 超常表现，单独分类，不计入负面异常统计

Step 4：多维交叉定位

对每个 Top 异常，从以下维度进行交叉分析（若报表中存在该维度）：

| 维度 | 分析方法 | |------|---------| | 区域维度 | 计算该区域所有行的指标均值，与全局均值对比 | | 产品维度 | 计算该产品线所有行的指标均值，与全局均值对比 | | 时间维度 | 检查该异常是否有连续性（同一区域+产品线是否多期异常） | | 基准维度 | 同时计算同比和偏差率，交叉验证异常是否双重触发 |

交叉定位输出格式：

**多维度交叉定位：**
- **区域维度**：{区域} 同比均值 {X}%（全局均值 {Y}%），{高于/低于} 全局 {Z} 个百分点
- **产品维度**：{产品} 偏差率均值 {X}%（全局均值 {Y}%），{高于/低于} 全局 {Z} 个百分点
- **时间维度**：{是否连续异常}（若是，列出连续异常日期）

Step 5：报告生成（六章节强制规范）

v3.0 改进：章节一增加列名映射说明章节；质量校验清单整合到执行流程末尾。

四、输出规范（六章节强制结构）

质量标准：章节 < 5 → 报告不完整；指标卡 < 5 → 关键指标不足；异常项 < 3 → 检测能力不足；具体建议 < 3 → 建议无落地性。以上标准在 quality_check_mode=strict 时为强制要求；quality_check_mode=auto 时为警告要求。

第一章：数据概况

必含内容：

数据规模：总行数、有效数据行数、字段数、时间跨度
维度拆解：列出识别出的所有维度（时间/区域/产品/目标等）及唯一值数量
描述性统计：所有数值列的 n/μ/σ/最小值/最大值/μ±2σ 区间（工具计算）
v3.0 新增：列名映射说明（若使用 column_mapping，列出原始列名→标准字段的映射关系）

章节校验标准：字段数 ≥ 5，描述性统计覆盖所有数值列

第二章：关键指标卡（≥ 5 个）

运营主题指标卡示例：

| # | 指标卡 | 数值 | 说明 | |---|--------|------|------| | ① | 总销售额/总费用 | {计算值} | 累计值，工具计算 | | ② | 整体同比增长率（均值） | {μ(yoy)} | 低于/高于行业均值 {X}% | | ③ | 整体计划完成率（加权均值偏差率） | {μ(deviation)} | 整体{达标/不达标}，但个体分化严重 | | ④ | 超计划项数占比 | {占比}% | {N}/{总行数} 项超过计划 | | ⑤ | 异常率（阈值法） | {占比}% | {N} 项触发偏差率/同比阈值 |

财务主题指标卡示例：

| # | 指标卡 | 数值 | |---|--------|------| | ① | 总费用 | {计算值} | | ② | 整体预算执行率（偏差率均值） | {μ(deviation)} | | ③ | 超预算部门数 | {N} 个 | | ④ | 最高单笔费用 | {max(amount_col)} | | ⑤ | 异常率（超预算比例） | {N} 笔 / {总笔数} |

行政主题指标卡示例：

| # | 指标卡 | 数值 | |---|--------|------| | ① | 整体出勤率/出车率 | {μ(metric_col)} | | ② | 整体偏差率 | {μ(deviation)} | | ③ | 不达标部门数 | {N} 个 | | ④ | 迟到/请假总人次 | {sum(count_col)} | | ⑤ | 超标准部门数 | {N} 个 |

第三章：对比分析（按 baseline_type 自适应）

| baseline_type | 章节名称 | 必含内容 | |--------------|---------|---------| | 同比 | 同比增长率分布 | 同比增长率按维度交叉（区域×产品线/部门×月份）矩阵，含区域均值和颜色标注 | | 环比 | 环比增长率分布 | 同上 | | 计划值 | 计划完成率分布 | 偏差率按区间分布（≥+30% / +15%~+30% / 0%~+15% / -15%~0% / ≤-15%）| | 同比+计划值 | 同比+计划值对比分析 | 同时包含同比分布和偏差率分布，交叉发现双重异常行 |

第四章：异常项识别与原因猜想（≥ 3 项）

v3.0 改进：Top 异常按严重程度排序，每项必含：触发方法、多维度定位、原因猜想（分"数据支持"和"需核实"两类）。

异常项格式：

#### 🔴 极严重 #{N}：{维度组合} · {核心指标} · {异常值}（{日期}）

| 项目 | 内容 |
|------|------|
| **触发方法** | {阈值法 / 标准差法 / 突变检测}（{具体条件}） |
| **严重程度** | 🔴 极严重 / 🔴 严重 / 🟡 注意 |
| **数据表现** | {实际值}；{计划值}（偏差{偏差率}%）；同比 {yoy}% |

**多维度交叉定位：**
- **区域维度**：{区域} {指标}均值 {X}%（全局均值 {Y}%），{高于/低于} 全局 {Z} 个百分点
- **产品/类别维度**：{产品} {指标}均值 {X}%
- **时间维度**：{是否有连续性，若有则列出日期}

**原因猜想（数据驱动）：**
1. **{猜想标题}**（{数据支持 / 需核实}）：{支撑数据或待核实事项}
2. **需进一步核实**：{需要业务人员确认的事项}

第五章：结论与建议（≥ 3 条可落地建议）

v3.0 改进：每条建议必含：对应异常编号、具体措施、预期效果、建议负责人、建议时限。

建议格式：

#### 建议{N}：【{优先级}】{建议标题}

| 项目 | 内容 |
|------|------|
| **对应异常** | #{异常编号}（{异常描述}） |
| **建议措施** | ① **{时间}**：{具体行动}<br>② **{时间}**：{具体行动} |
| **预期效果** | {量化预期} |
| **建议负责人** | {角色或部门} |
| **建议时限** | {时间要求} |

第六章：口径说明与质量校验（v3.0 整合）

口径说明内容（按 report_theme + custom_calibration 自适应生成）：

| 口径项 | 定义 | |--------|------| | 同比增长率 | （本期值 - 去年同期值）/ 去年同期值，数值格式为小数（-0.30 = -30%）| | 环比增长率 | （本期值 - 上期值）/ 上期值 | | 偏差率 | （实际值 - 计划值）/ 计划值，正值=超计划，负值=低于计划 | | 异常阈值（默认） | 同比下降 ≥ 30%；|偏差率| ≥ 15%；标准差偏离 > μ±2σ；环比变化 > ±50% | | 标准差法说明 | 数据需近似正态分布；行数 < 20 时自动降级为阈值法；偏态数据仅供参考 | | 缺失值处理 | 缺失值按该列均值填充（比率列按 0 填充），并在报告中注明 |

v3.0 质量自检结果（执行流程末尾自动生成）：

## 六·二、质量自检清单（v3.0 自动校验 ✅）

| 质量维度 | 要求 | 实际 | 结果 |
|---------|------|------|------|
| 数据行数 | ≥ 30 行 | {N} 行 | ✅/❌ |
| 字段数 | ≥ 5 列 | {N} 列 | ✅/❌ |
| 报告章节数 | ≥ 5 章节 | {N} 章节 | ✅/❌ |
| 关键指标卡 | ≥ 5 个 | {N} 个 | ✅/❌ |
| 异常项识别 | ≥ 3 项 | {N} 项（Top {N}） | ✅/❌ |
| 具体建议 | ≥ 3 条（均含负责人+时限） | {N} 条 | ✅/❌ |
| 数值计算方式 | 工具计算 | Python工具计算 | ✅ |
| 多维度分析 | 区域×产品线/部门×月份 | 已执行 | ✅ |
| 异常检测方法 | ≥ 2 种 | {N} 种（阈值/标准差/突变） | ✅ |
| 原因猜想数据驱动 | 每条均含数据支撑或"需核实" | 全部符合 | ✅ |
| 列名映射记录 | 若使用 column_mapping，记录原始→标准映射 | 已记录/未使用 | ✅/ℹ️ |

**总体评定**：{通过 / 有警告 / 不通过}

五、报表类型 → 异常维度映射表（v2.0 新增，v3.0 扩展）

v3.0 改进：扩展异常维度覆盖，增加财务/行政场景的具体阈值说明。

5.1 运营主题（report_theme = 运营）

| 异常类型 | 核心指标 | 默认阈值 | 严重程度分级 | |---------|---------|---------|------------| | 同比严重下滑 | yoy_col | ≤ -0.30 | -0.30~-0.50 🟡；≤ -0.50 🔴 | | 偏差率负向 | deviation_col | ≤ -0.15 | -0.15~-0.30 🟡；≤ -0.30 🔴 | | 偏差率正向极端 | deviation_col | ≥ +0.30 | ≥ +0.30 ⚠️ 超常 | | 环比突变暴涨 | qoq_col | ≥ +0.50 | ≥ +0.50 🟡（需分析是否异常）| | 环比突变暴跌 | qoq_col | ≤ -0.50 | -0.50~-0.70 🟠；≤ -0.70 🔴 | | 标准差异常 | metric_col | > μ±2σ | 低于下界 🔴；高于上界 ⚠️ |

5.2 财务主题（report_theme = 财务）

| 异常类型 | 核心指标 | 默认阈值 | 严重程度分级 | |---------|---------|---------|------------| | 超预算严重 | deviation_col | ≥ +0.20 | +0.20~+0.50 🟡；≥ +0.50 🔴 | | 严重节余 | deviation_col | ≤ -0.30 | ⚠️ 异常偏低（可能资金未使用） | | 单笔费用极高 | amount_col | > μ+2σ | 🟡 超常 | | 报销频次异常 | count_col | 同比 > +0.50 | 🟡 报销频次暴涨（需核实）| | 部门费用集中 | 某部门费用占比 | > 40% | 🟡 费用过度集中某部门 |

5.3 行政主题（report_theme = 行政）

| 异常类型 | 核心指标 | 默认阈值 | 严重程度分级 | |---------|---------|---------|------------| | 出勤率严重偏低 | metric_col（出勤率） | < 85% | 75%~85% 🟡；< 75% 🔴 | | 偏差率不达标 | deviation_col | ≤ -0.10 | -0.10~-0.20 🟡；≤ -0.20 🔴 | | 迟到人次过多 | count_col（迟到） | > 5人次/部门平均人数×10% | 🟡 注意（无固定阈值）| | 请假人次过多 | count_col（请假） | > 部门平均请假×2倍 | 🟡 参考项（无固定阈值）| | 出车率极高 | metric_col（出车率） | > 95% | ⚠️ 出车率极高，可能外勤管理松散 | | 出车率极低 | metric_col（出车率） | < 50% | 🟡 车辆闲置率过高 |

注意：行政主题的计数型指标（迟到、请假、出车次数）无固定阈值，作为"软性参考项"呈现在报告中，不触发异常标记，但作为背景信息辅助判断。

六、约束事项与已知局限

| 约束项 | 说明 | |--------|------| | 数据规模 | 最少 30 行（不含表头），行数不足时报告质量不可靠 | | 列名识别 | 若列名包含生僻字或特殊缩写，自动识别可能失败，请使用 column_mapping 显式声明 | | 偏差率计算 | 若报表既无 deviation_col 也无 plan_col，报告将不包含偏差率分析章节 | | 同比数据 | 若报表无同比列，baseline_type 强制降级为"计划值"或"环比" | | 标准差法 | 行数 < 20 或数据严重偏态时自动降级为阈值法 | | 报告语言 | 目前仅支持简体中文输出 | | 多语言报表 | 若列名为英文，需在 column_mapping 中传入英文字段名映射 | | 置信区间 | 目前仅使用 μ±2σ，未来可扩展为按偏态自适应（IQR 法替代）|

七、使用示例

示例一：标准运营报表分析

输入数据：[粘贴 CSV 内容]
report_theme: 运营
baseline_type: 同比+计划值
column_mapping: {"metric_col": "销售额_元", "yoy_col": "同比增长率", "deviation_col": "偏差率"}
quality_check_mode: auto

示例二：财务费用报表分析（仅计划值基准）

输入数据：[粘贴 Markdown 表格内容]
report_theme: 财务
baseline_type: 计划值
column_mapping: {"amount_col": "实际报销_元", "budget_col": "预算额度_元", "deviation_col": "超支率"}
anomaly_params: {"deviation_threshold": 0.20, "yoy_threshold": -0.20}
quality_check_mode: strict

示例三：行政考勤月报（仅计划值基准 + 自定义口径）

输入数据：[粘贴 Markdown 表格内容]
report_theme: 行政
baseline_type: 计划值
column_mapping: {"metric_col": "出勤率", "deviation_col": "偏差率"}
custom_calibration: |
  ① 数据口径：出勤率=（应勤天数-缺勤天数）/应勤天数；外勤人员按实际打卡天数折算；迟到≥9:05打卡计迟到1次。
  ② 异常口径：部门平均出勤率低于85%为严重；低于95%为注意；豁免规则：外勤人员豁免打卡率考核。
  ③ 数据质量：缺失值（未打卡）按0.5天计算；离职当月按实际上班天数统计。
quality_check_mode: auto

八、版本记录

| 版本 | 日期 | 变更说明 | |------|------|---------| | v1.0 | 2026-05-08 | 首次试跑，支持 CSV 销售报表，同比/环比双基准，阈值法异常检测 | | v1.1 | 2026-05-08 | 增加 Markdown 表格解析，质量校验清单（11项全部可验证），改善异常项输出格式 | | v1.2 | 2026-05-08 | 增加多维交叉分析（区域×产品线矩阵），增加描述性统计（n/μ/σ/μ±2σ），增加 Top 10 异常详情 | | v2.0 | 2026-05-08 | 三重复合异常检测（阈值法+标准差法+突变检测），4级严重程度量化，报表类型→异常维度映射表，运营/财务/行政三大主题适配，行政考勤计数型指标软性参考机制 | | v3.0 | 2026-05-08 | ① 列名硬编码改为参数化映射表（column_mapping + 自动识别双轨）② 质量自检机制嵌入执行流程（Step 0 前置校验，strict/auto/loose/none 四模式）③ 标准差法增加正态分布假设说明和自动降级策略 ④ custom_calibration 结构化引导（数据口径/异常口径/数据质量三段式）⑤ anomaly_params 参数支持阈值覆盖 ⑥ 新增财务/行政主题具体异常阈值 ⑦ 质量校验清单整合到报告第六章 ⑧ TestBench 断言脚本（scripts/test_report_skill.py）⑨ 平行测试数据集（references/财务_费用报表_测试数据.csv + references/行政_用车报表_测试数据.md） |