返回 Skill 列表
extension
分类: 数据与分析无需 API Key

报表数据分析

对 CSV / Markdown 表格格式的业务报表进行结构化分析,自动识别异常并输出亮点-异常-原因-建议四段式报告

person作者: user_d680b30fhubcommunity

SKILL.md — 报表数据分析(v3.0)

版本记录:v1.0(首次试跑)→ v1.1(增加 Markdown 表格支持 + 质量校验清单)→ v1.2(增加多维交叉分析 + 描述性统计)→ v2.0(三重复合异常检测 + 报表类型映射表 + 考勤/财务主题适配)→ v3.0(列名参数化映射 + 质量自检机制嵌入执行流程 + 标准差法假设说明 + 结构化 custom_calibration + TestBench 脚本)


一、核心价值主张

本 Skill 将日常业务报表(销售/费用/考勤/用车等)的分析工作,从"每次手动看表"升级为"一键标准化报告输出",核心解决以下问题:

| 问题 | 解决方案 | |------|---------| | 异常靠肉眼找,容易遗漏 | 三重复合异常检测(阈值法 + 标准差法 + 突变检测)自动标红 | | 不同主题报表格式不同 | 列名自动识别 + 参数化映射表,兼容任意列名 | | 报告结构不统一,质量参差不齐 | 六章节强制规范 + 质量自检 Checklist | | 异常原因靠猜,建议不落地 | 数据驱动原因猜想 + 具体可执行建议(负责人 + 时限) | | 换报表主题后异常维度不匹配 | 报表类型 → 异常维度映射表覆盖运营/财务/行政三大主题 |


二、输入字段标准对照表(column_mapping 参考)

v3.0 核心改进:不再硬编码列名,改为列名自动识别 + 显式参数化映射双轨机制。 优先使用 column_mapping 参数显式声明;若未声明则按关键词模糊匹配。

2.1 运营主题(report_theme = 运营)

| 标准字段 | 自动识别关键词 | 说明 | |---------|-------------|------| | date_col | 日期、时间、period、周期 | 时间维度 | | region_col | 区域、大区、省份、城市 | 空间维度 | | product_col | 产品、产品线、类型、category | 产品维度 | | metric_col | 销售额、收入、金额、元、万 | 核心数值(默认分析对象) | | yoy_col | 同比、YoY、yoy、同比增长 | 同比增长率列(数值格式,支持小数或百分比) | | qoq_col | 环比、QoQ、qoq、上期 | 环比增长率列 | | plan_col | 计划、目标、预算、target | 计划销售额列 | | deviation_col | 偏差、deviation、差异、超计划 | 偏差率列(正=超计划,负=低于计划) | | quantity_col | 数量、单、笔、件、人次 | 销售数量列(用于描述性统计) |

2.2 财务主题(report_theme = 财务)

| 标准字段 | 自动识别关键词 | 说明 | |---------|-------------|------| | date_col | 日期、时间 | 时间维度 | | dept_col | 部门、中心、科室 | 费用归属部门 | | category_col | 类别、科目、项目、type | 费用类型(差旅/办公/招待等) | | amount_col | 费用、报销、支出、金额、元 | 实际报销金额 | | budget_col | 预算、额度、指标 | 预算金额 | | deviation_col | 偏差、超支、节余、deviation | 预算偏差率 | | count_col | 笔、单、人次 | 报销单数量 |

2.3 行政主题(report_theme = 行政)

| 标准字段 | 自动识别关键词 | 说明 | |---------|-------------|------| | date_col | 日期、时间 | 时间维度 | | dept_col | 部门、科室 | 部门维度 | | entity_col | 人员、司机、车牌、物品 | 具体对象(考勤=人员;用车=车辆/司机) | | metric_col | 出勤率、出车率、库存周转 | 核心效率指标 | | target_col | 计划、目标、出勤率目标 | 目标值 | | deviation_col | 偏差、deviation、差异 | 偏差率 | | count_col | 迟到、请假、出车、借用 | 计数型指标(软性参考,不触发异常) |

2.4 列名映射使用示例

场景:用户报表的销售额列叫"实际营收(万元)",偏差率列叫"执行偏差",其他列名恰好匹配。

column_mapping = {
  "metric_col": "实际营收(万元)",
  "deviation_col": "执行偏差",
  "yoy_col": "同比增长率"
}

提示:Agent 在执行 Step 1 时,先检查 column_mapping 是否显式传入;若有则直接使用字段映射;若没有则按关键词自动识别;若识别失败则在执行前向用户确认。


三、执行流程(v3.0 完整流程)

Step 0:前置校验(新增 · 质量自检嵌入)

v3.0 核心改进:将质量校验从"事后检查"变为"执行前阻断",不合格不生成报告,直接报错并给出缺失清单。

0.1 数据基础校验

| 校验项 | 要求 | 不满足时的行为 | |--------|------|--------------| | 数据行数 | ≥ 30 行(不含表头) | quality_check_mode=auto/strict → 报错中止;loose → 生成参考报告并注明数据不足 | | 字段数 | ≥ 5 列 | 同上 | | 对比基准列存在 | 根据 baseline_type 校验对应列是否存在 | 报错并列出缺失列名 | | 列名可识别 | 至少识别出 date_col 和 metric_col | 若 column_mapping 未传且自动识别失败 → 中止并要求用户提供映射表 | | 数值格式 | 指标列和比率列必须为数值型(非文本) | 标注格式异常行,继续执行(loose 模式) |

0.2 质量标准校验(仅在 quality_check_mode=auto/strict 时执行)

| 质量维度 | 具体标准 | 不满足时的处理 | |---------|---------|--------------| | 数据完整性 | 缺失值比例 < 10% | 输出警告,继续执行 | | 异常覆盖性 | 至少存在 1 个真实异常(即至少 1 行满足异常检测条件) | 输出警告,继续执行(防止全部正常导致报告空洞) | | 多维度性 | 至少存在 2 个不同维度(如区域+产品线;部门+月份) | 输出警告,继续执行 | | 时间跨度 | 时间列跨度 ≥ 5 天 | 输出警告,标准差法降级为阈值法 |

校验输出格式(不符合时输出):

⚠️ 前置校验发现以下问题:
1. [ERROR] 数据行数为 {N} 行,不满足 ≥30 行要求 → 请补充数据
2. [WARN] 对比基准列"同比增长率"未找到 → 请检查 column_mapping 或确认报表格式
3. [INFO] 数据行数不足 20 行,标准差法将降级为阈值法

执行策略:quality_check_mode={mode} → {继续执行 / 中止}

Step 1:数据解析与列名标准化

1.1 格式识别

  • 若 report_data 首行包含逗号(,)且不以 | 开头 → 识别为 CSV
  • 若包含管道符(|)→ 识别为 Markdown 表格
  • 若两种都包含 → 优先 CSV,忽略 Markdown 格式的描述文字

1.2 列名标准化

  • 若 column_mapping 已传入:直接使用映射关系,将原始列名重命名为标准字段名
  • 若未传入:按关键词自动识别(见第二节对照表),识别结果在报告中注明
  • 自动识别失败时:中止执行,要求用户补充 column_mapping

1.3 数据清洗

  • 移除表头行后的纯数据行参与统计
  • 若 metric_col 或 yoy_col 等数值列出现文本值(如"无数据"、"N/A"),标记为缺失值
  • 偏差率计算规则:
    • 若已存在 deviation_col:直接使用
    • 若无 deviation_col 但有 plan_col:计算 偏差率 = (metric_col - plan_col) / plan_col
    • 若既无 deviation_col 也无 plan_col:仅做同比/环比分析,不计算偏差率

v3.0 列名映射表示例(销售报表)

| 原始列名 | 映射后标准字段 | |---------|--------------| | 日期 | date_col | | 产品线 | product_col | | 区域 | region_col | | 销售额_元 | metric_col | | 销售数量 | quantity_col | | 环比增长率 | qoq_col | | 同比增长率 | yoy_col | | 计划销售额_元 | plan_col | | 偏差率 | deviation_col |


Step 2:描述性统计(工具计算)

v3.0 改进:标准差法增加正态分布假设说明,明确适用条件。

使用 Python 工具对所有数值列计算以下统计量:

| 统计量 | 计算方法 | 说明 | |--------|---------|------| | n | COUNT | 有效数据行数 | | 均值 (μ) | SUM/n | 算术平均数 | | 标准差 (σ) | STDDEV(n) | 衡量数据离散程度 | | 最小值 | MIN | 数据下界 | | 最大值 | MAX | 数据上界 | | μ±2σ 区间 | μ±2σ | 标准差法异常判定区间 |

关于标准差法的正态分布假设说明(v3.0 新增)

⚠️ 重要前提:标准差法的有效性依赖于数据近似服从正态分布(均值两侧数据大致对称)。若数据严重偏态(如收入分布右偏),标准差法结果可能失准。

不适用标准差法的典型场景

  • 数据行数 < 20(样本量不足,σ 估计不可靠)
  • 数据存在极端异常值(σ 被异常值放大,导致 μ±2σ 区间过宽,漏检真正的异常)
  • 数据明显非正态分布(如费用报表中少数大额订单拉高均值)

自动降级策略:若数据行数 < std_min_rows(默认 20),自动跳过标准差法,仅使用阈值法;若 std_min_rows 已设置但 < 20,强制使用 20 作为最小值。

替代建议:对于偏态数据,优先使用中位数 ± MAD(绝对离差中位数)法或直接使用阈值法,并注明"数据偏态,标准差法结果仅供参考"。


Step 3:异常检测(三重复合)

v3.0 改进:支持 anomaly_params 参数覆盖默认阈值;明确异常检测优先顺序。

3.1 检测方法一:阈值法(所有主题均适用)

| 异常类型 | 判定条件 | 严重程度 | |---------|---------|---------| | 同比严重下降 | yoy_col ≤ yoy_threshold(默认 -0.30,即 -30%) | 🔴 极严重 | | 偏差率正向极端 | deviation_col ≥ deviation_threshold(默认 +0.30,即 +30%) | 🟠 异常偏高(正向警示) | | 偏差率负向极端 | deviation_col ≤ -deviation_threshold(默认 -0.15,即 -15%) | 🔴 极严重 | | 环比突变暴涨 | qoq_col ≥ mutation_threshold(默认 +0.50,即 +50%) | 🟡 注意(暴涨可能掩盖质量问题) | | 环比突变暴跌 | qoq_col ≤ -mutation_threshold(默认 -0.50,即 -50%) | 🟠 严重(暴跌需立即关注) |

阈值覆盖:通过 anomaly_params 参数可覆盖默认阈值,例如将同比阈值从 -30% 收紧到 -20%。

3.2 检测方法二:标准差法(行数 ≥ std_min_rows 时启用)

  • 计算 metric_col 的均值 μ 和标准差 σ
  • 异常判定:metric_col < μ - std_sigma × σmetric_col > μ + std_sigma × σ (std_sigma 默认值为 2,即 μ±2σ)
  • 正向极端(超出上界):标记为 ⚠️ 超常表现,不计入负面异常,但作为重要发现单独列出
  • 负向极端(低于下界):标记为 🔴 极严重异常

3.3 检测方法三:环比突变检测(所有主题均适用)

  • 判定条件:|qoq_col| > mutation_threshold
  • 同时触发阈值法时,优先采用阈值法的严重程度评级

3.4 三种方法的优先级与合并规则

优先级:阈值法 > 标准差法 > 环比突变检测

合并规则:
1. 若同一行同时被阈值法和标准差法检测 → 采用阈值法的严重程度
2. 若同一行同时被阈值法和环比突变检测 → 采用阈值法的严重程度
3. 异常汇总表列出每行触发的所有方法,供读者交叉验证
4. 标准差法正向极端(metric_col > μ + 2σ)→ ⚠️ 超常表现,单独分类,不计入负面异常统计

Step 4:多维交叉定位

对每个 Top 异常,从以下维度进行交叉分析(若报表中存在该维度):

| 维度 | 分析方法 | |------|---------| | 区域维度 | 计算该区域所有行的指标均值,与全局均值对比 | | 产品维度 | 计算该产品线所有行的指标均值,与全局均值对比 | | 时间维度 | 检查该异常是否有连续性(同一区域+产品线是否多期异常) | | 基准维度 | 同时计算同比和偏差率,交叉验证异常是否双重触发 |

交叉定位输出格式

**多维度交叉定位:**
- **区域维度**:{区域} 同比均值 {X}%(全局均值 {Y}%),{高于/低于} 全局 {Z} 个百分点
- **产品维度**:{产品} 偏差率均值 {X}%(全局均值 {Y}%),{高于/低于} 全局 {Z} 个百分点
- **时间维度**:{是否连续异常}(若是,列出连续异常日期)

Step 5:报告生成(六章节强制规范)

v3.0 改进:章节一增加列名映射说明章节;质量校验清单整合到执行流程末尾。


四、输出规范(六章节强制结构)

质量标准:章节 < 5 → 报告不完整;指标卡 < 5 → 关键指标不足;异常项 < 3 → 检测能力不足;具体建议 < 3 → 建议无落地性。 以上标准在 quality_check_mode=strict 时为强制要求;quality_check_mode=auto 时为警告要求。

第一章:数据概况

必含内容

  • 数据规模:总行数、有效数据行数、字段数、时间跨度
  • 维度拆解:列出识别出的所有维度(时间/区域/产品/目标等)及唯一值数量
  • 描述性统计:所有数值列的 n/μ/σ/最小值/最大值/μ±2σ 区间(工具计算)
  • v3.0 新增:列名映射说明(若使用 column_mapping,列出原始列名→标准字段的映射关系)

章节校验标准:字段数 ≥ 5,描述性统计覆盖所有数值列

第二章:关键指标卡(≥ 5 个)

运营主题指标卡示例

| # | 指标卡 | 数值 | 说明 | |---|--------|------|------| | ① | 总销售额/总费用 | {计算值} | 累计值,工具计算 | | ② | 整体同比增长率(均值) | {μ(yoy)} | 低于/高于行业均值 {X}% | | ③ | 整体计划完成率(加权均值偏差率) | {μ(deviation)} | 整体{达标/不达标},但个体分化严重 | | ④ | 超计划项数占比 | {占比}% | {N}/{总行数} 项超过计划 | | ⑤ | 异常率(阈值法) | {占比}% | {N} 项触发偏差率/同比阈值 |

财务主题指标卡示例

| # | 指标卡 | 数值 | |---|--------|------| | ① | 总费用 | {计算值} | | ② | 整体预算执行率(偏差率均值) | {μ(deviation)} | | ③ | 超预算部门数 | {N} 个 | | ④ | 最高单笔费用 | {max(amount_col)} | | ⑤ | 异常率(超预算比例) | {N} 笔 / {总笔数} |

行政主题指标卡示例

| # | 指标卡 | 数值 | |---|--------|------| | ① | 整体出勤率/出车率 | {μ(metric_col)} | | ② | 整体偏差率 | {μ(deviation)} | | ③ | 不达标部门数 | {N} 个 | | ④ | 迟到/请假总人次 | {sum(count_col)} | | ⑤ | 超标准部门数 | {N} 个 |

第三章:对比分析(按 baseline_type 自适应)

| baseline_type | 章节名称 | 必含内容 | |--------------|---------|---------| | 同比 | 同比增长率分布 | 同比增长率按维度交叉(区域×产品线/部门×月份)矩阵,含区域均值和颜色标注 | | 环比 | 环比增长率分布 | 同上 | | 计划值 | 计划完成率分布 | 偏差率按区间分布(≥+30% / +15%~+30% / 0%~+15% / -15%~0% / ≤-15%)| | 同比+计划值 | 同比+计划值对比分析 | 同时包含同比分布和偏差率分布,交叉发现双重异常行 |

第四章:异常项识别与原因猜想(≥ 3 项)

v3.0 改进:Top 异常按严重程度排序,每项必含:触发方法、多维度定位、原因猜想(分"数据支持"和"需核实"两类)。

异常项格式

#### 🔴 极严重 #{N}:{维度组合} · {核心指标} · {异常值}({日期})

| 项目 | 内容 |
|------|------|
| **触发方法** | {阈值法 / 标准差法 / 突变检测}({具体条件}) |
| **严重程度** | 🔴 极严重 / 🔴 严重 / 🟡 注意 |
| **数据表现** | {实际值};{计划值}(偏差{偏差率}%);同比 {yoy}% |

**多维度交叉定位:**
- **区域维度**:{区域} {指标}均值 {X}%(全局均值 {Y}%),{高于/低于} 全局 {Z} 个百分点
- **产品/类别维度**:{产品} {指标}均值 {X}%
- **时间维度**:{是否有连续性,若有则列出日期}

**原因猜想(数据驱动):**
1. **{猜想标题}**({数据支持 / 需核实}):{支撑数据或待核实事项}
2. **需进一步核实**:{需要业务人员确认的事项}

第五章:结论与建议(≥ 3 条可落地建议)

v3.0 改进:每条建议必含:对应异常编号、具体措施、预期效果、建议负责人、建议时限。

建议格式

#### 建议{N}:【{优先级}】{建议标题}

| 项目 | 内容 |
|------|------|
| **对应异常** | #{异常编号}({异常描述}) |
| **建议措施** | ① **{时间}**:{具体行动}<br>**{时间}**:{具体行动} |
| **预期效果** | {量化预期} |
| **建议负责人** | {角色或部门} |
| **建议时限** | {时间要求} |

第六章:口径说明与质量校验(v3.0 整合)

口径说明内容(按 report_theme + custom_calibration 自适应生成):

| 口径项 | 定义 | |--------|------| | 同比增长率 | (本期值 - 去年同期值)/ 去年同期值,数值格式为小数(-0.30 = -30%)| | 环比增长率 | (本期值 - 上期值)/ 上期值 | | 偏差率 | (实际值 - 计划值)/ 计划值,正值=超计划,负值=低于计划 | | 异常阈值(默认) | 同比下降 ≥ 30%;|偏差率| ≥ 15%;标准差偏离 > μ±2σ;环比变化 > ±50% | | 标准差法说明 | 数据需近似正态分布;行数 < 20 时自动降级为阈值法;偏态数据仅供参考 | | 缺失值处理 | 缺失值按该列均值填充(比率列按 0 填充),并在报告中注明 |

v3.0 质量自检结果(执行流程末尾自动生成)

## 六·二、质量自检清单(v3.0 自动校验 ✅)

| 质量维度 | 要求 | 实际 | 结果 |
|---------|------|------|------|
| 数据行数 | ≥ 30 行 | {N} 行 | ✅/❌ |
| 字段数 | ≥ 5 列 | {N} 列 | ✅/❌ |
| 报告章节数 | ≥ 5 章节 | {N} 章节 | ✅/❌ |
| 关键指标卡 | ≥ 5 个 | {N} 个 | ✅/❌ |
| 异常项识别 | ≥ 3 项 | {N} 项(Top {N}) | ✅/❌ |
| 具体建议 | ≥ 3 条(均含负责人+时限) | {N} 条 | ✅/❌ |
| 数值计算方式 | 工具计算 | Python工具计算 | ✅ |
| 多维度分析 | 区域×产品线/部门×月份 | 已执行 | ✅ |
| 异常检测方法 | ≥ 2 种 | {N} 种(阈值/标准差/突变) | ✅ |
| 原因猜想数据驱动 | 每条均含数据支撑或"需核实" | 全部符合 | ✅ |
| 列名映射记录 | 若使用 column_mapping,记录原始→标准映射 | 已记录/未使用 | ✅/ℹ️ |

**总体评定**:{通过 / 有警告 / 不通过}

五、报表类型 → 异常维度映射表(v2.0 新增,v3.0 扩展)

v3.0 改进:扩展异常维度覆盖,增加财务/行政场景的具体阈值说明。

5.1 运营主题(report_theme = 运营)

| 异常类型 | 核心指标 | 默认阈值 | 严重程度分级 | |---------|---------|---------|------------| | 同比严重下滑 | yoy_col | ≤ -0.30 | -0.30~-0.50 🟡;≤ -0.50 🔴 | | 偏差率负向 | deviation_col | ≤ -0.15 | -0.15~-0.30 🟡;≤ -0.30 🔴 | | 偏差率正向极端 | deviation_col | ≥ +0.30 | ≥ +0.30 ⚠️ 超常 | | 环比突变暴涨 | qoq_col | ≥ +0.50 | ≥ +0.50 🟡(需分析是否异常)| | 环比突变暴跌 | qoq_col | ≤ -0.50 | -0.50~-0.70 🟠;≤ -0.70 🔴 | | 标准差异常 | metric_col | > μ±2σ | 低于下界 🔴;高于上界 ⚠️ |

5.2 财务主题(report_theme = 财务)

| 异常类型 | 核心指标 | 默认阈值 | 严重程度分级 | |---------|---------|---------|------------| | 超预算严重 | deviation_col | ≥ +0.20 | +0.20~+0.50 🟡;≥ +0.50 🔴 | | 严重节余 | deviation_col | ≤ -0.30 | ⚠️ 异常偏低(可能资金未使用) | | 单笔费用极高 | amount_col | > μ+2σ | 🟡 超常 | | 报销频次异常 | count_col | 同比 > +0.50 | 🟡 报销频次暴涨(需核实)| | 部门费用集中 | 某部门费用占比 | > 40% | 🟡 费用过度集中某部门 |

5.3 行政主题(report_theme = 行政)

| 异常类型 | 核心指标 | 默认阈值 | 严重程度分级 | |---------|---------|---------|------------| | 出勤率严重偏低 | metric_col(出勤率) | < 85% | 75%~85% 🟡;< 75% 🔴 | | 偏差率不达标 | deviation_col | ≤ -0.10 | -0.10~-0.20 🟡;≤ -0.20 🔴 | | 迟到人次过多 | count_col(迟到) | > 5人次/部门平均人数×10% | 🟡 注意(无固定阈值)| | 请假人次过多 | count_col(请假) | > 部门平均请假×2倍 | 🟡 参考项(无固定阈值)| | 出车率极高 | metric_col(出车率) | > 95% | ⚠️ 出车率极高,可能外勤管理松散 | | 出车率极低 | metric_col(出车率) | < 50% | 🟡 车辆闲置率过高 |

注意:行政主题的计数型指标(迟到、请假、出车次数)无固定阈值,作为"软性参考项"呈现在报告中,不触发异常标记,但作为背景信息辅助判断。


六、约束事项与已知局限

| 约束项 | 说明 | |--------|------| | 数据规模 | 最少 30 行(不含表头),行数不足时报告质量不可靠 | | 列名识别 | 若列名包含生僻字或特殊缩写,自动识别可能失败,请使用 column_mapping 显式声明 | | 偏差率计算 | 若报表既无 deviation_col 也无 plan_col,报告将不包含偏差率分析章节 | | 同比数据 | 若报表无同比列,baseline_type 强制降级为"计划值"或"环比" | | 标准差法 | 行数 < 20 或数据严重偏态时自动降级为阈值法 | | 报告语言 | 目前仅支持简体中文输出 | | 多语言报表 | 若列名为英文,需在 column_mapping 中传入英文字段名映射 | | 置信区间 | 目前仅使用 μ±2σ,未来可扩展为按偏态自适应(IQR 法替代)|


七、使用示例

示例一:标准运营报表分析

输入数据:[粘贴 CSV 内容]
report_theme: 运营
baseline_type: 同比+计划值
column_mapping: {"metric_col": "销售额_元", "yoy_col": "同比增长率", "deviation_col": "偏差率"}
quality_check_mode: auto

示例二:财务费用报表分析(仅计划值基准)

输入数据:[粘贴 Markdown 表格内容]
report_theme: 财务
baseline_type: 计划值
column_mapping: {"amount_col": "实际报销_元", "budget_col": "预算额度_元", "deviation_col": "超支率"}
anomaly_params: {"deviation_threshold": 0.20, "yoy_threshold": -0.20}
quality_check_mode: strict

示例三:行政考勤月报(仅计划值基准 + 自定义口径)

输入数据:[粘贴 Markdown 表格内容]
report_theme: 行政
baseline_type: 计划值
column_mapping: {"metric_col": "出勤率", "deviation_col": "偏差率"}
custom_calibration: |
  ① 数据口径:出勤率=(应勤天数-缺勤天数)/应勤天数;外勤人员按实际打卡天数折算;迟到≥9:05打卡计迟到1次。
  ② 异常口径:部门平均出勤率低于85%为严重;低于95%为注意;豁免规则:外勤人员豁免打卡率考核。
  ③ 数据质量:缺失值(未打卡)按0.5天计算;离职当月按实际上班天数统计。
quality_check_mode: auto

八、版本记录

| 版本 | 日期 | 变更说明 | |------|------|---------| | v1.0 | 2026-05-08 | 首次试跑,支持 CSV 销售报表,同比/环比双基准,阈值法异常检测 | | v1.1 | 2026-05-08 | 增加 Markdown 表格解析,质量校验清单(11项全部可验证),改善异常项输出格式 | | v1.2 | 2026-05-08 | 增加多维交叉分析(区域×产品线矩阵),增加描述性统计(n/μ/σ/μ±2σ),增加 Top 10 异常详情 | | v2.0 | 2026-05-08 | 三重复合异常检测(阈值法+标准差法+突变检测),4级严重程度量化,报表类型→异常维度映射表,运营/财务/行政三大主题适配,行政考勤计数型指标软性参考机制 | | v3.0 | 2026-05-08 | ① 列名硬编码改为参数化映射表(column_mapping + 自动识别双轨)② 质量自检机制嵌入执行流程(Step 0 前置校验,strict/auto/loose/none 四模式)③ 标准差法增加正态分布假设说明和自动降级策略 ④ custom_calibration 结构化引导(数据口径/异常口径/数据质量三段式)⑤ anomaly_params 参数支持阈值覆盖 ⑥ 新增财务/行政主题具体异常阈值 ⑦ 质量校验清单整合到报告第六章 ⑧ TestBench 断言脚本(scripts/test_report_skill.py)⑨ 平行测试数据集(references/财务_费用报表_测试数据.csv + references/行政_用车报表_测试数据.md) |