W复购指标计算器
概述
本 skill 提供一套标准化、可校验的电商复购指标计算方案。核心能力:
- 固定口径计算:活跃用户/复购用户/月复购率/人均复购次数/复购GMV占比/用户分层
- 六级校验流水线:值域校验 → 交叉等式验算 → 分布占比求和校验 → 环比校验 → 样本量级校验 → 二次重算复核
- 批量处理:支持 CSV/JSON/Excel 输入,输出结构化 JSON 指标报告
所有计算口径与校验规则均固定,不可修改。
使用方式
方式一:命令行调用(推荐批量场景)
python scripts/calculate_repurchase.py <输入文件> -p "2025-06" -o report.json
支持参数:
input:CSV/JSON/Excel 文件路径-p, --period:统计周期标签(如 2025-06)-o, --output:输出 JSON 路径(默认 stdout)--prev:上期指标 JSON(用于环比校验)
方式二:Python API(嵌入分析流程)
import pandas as pd
from scripts.calculate_repurchase import batch_calculate
df = pd.read_csv("orders_202506.csv")
report = batch_calculate(df, period_label="2025-06")
print(report["状态"]) # PASS / WARNING / INSUFFICIENT_SAMPLE
方式三:对话式分析(用户上传数据)
当用户在对话中提供订单数据文件或描述数据结构时:
- 读取数据文件(CSV/Excel/JSON)
- 确认列名映射(user_id / amount / order_time)
- 调用
scripts/calculate_repurchase.py的batch_calculate()函数 - 解读输出报告,重点分析:
- 核心指标数值与趋势
- 用户分层结构
- 复购频次与间隔分布
- 校验结果与异常明细
执行流程
原始数据 → 数据清洗 → 批量计算 → 值域校验 → 交叉等式验算 → 分布占比校验 → 环比重算 → 样本量校验 → 二次重算复核 → 输出报告
全部校验通过 → 输出完整指标报告 任意校验失败 → 输出异常明细 + 失败项详情
重要规则
- 计算口径不可修改:所有公式和阈值均为固定值,详见
references/calculation_rules.md - 样本不足时禁止输出分层方案:活跃用户 < 30 或复购用户 < 10 时,不输出用户分层与归因经营方案
- 脏数据自动拦截:值域越界(负数、超100%百分比)判定为原始数据问题,中止输出
- 校验优先于报告:任意校验失败都会在报告中明确标注,不可跳过
输出解读要点
- 状态 = PASS:数据质量合格,指标可采信
- 状态 = WARNING:存在校验异常但非致命(如环比波动过大),需人工确认
- 状态 = INSUFFICIENT_SAMPLE:样本不足,不可用于经营决策
- 状态 = ERROR:无有效数据或数据格式异常
文件结构
w-repurchase-calculator/
├── SKILL.md # 本文件
├── scripts/
│ └── calculate_repurchase.py # 核心计算与校验引擎
└── references/
└── calculation_rules.md # 完整计算口径与校验规则参考
Scan to join WeChat group