Test Report Skill
一句话说明
分析 v3.5 生产部署器日志,生成测试报告和统计数据。
适用场景
- 📊 监控 v3.5 运行状态和性能指标
- 📈 对比 v3.0 和 v3.5 表现差异
- 🎯 分析策略分布和使用频率
- 📝 生成实验报告和数据可视化
快速开始
生成测试报告
python3 scripts/generate_report.py
示例输出
============================================================
v3.5 生产部署器测试报告
============================================================
生成时间: 2025-03-26 15:00:00
------------------------------------------------------------
📊 总体统计:
总运行次数: 100
v3.5 运行: 85 (85%)
v3.0 运行: 15 (15%)
🎯 平均赞数:
v3.5: 35.2 赞
v3.0: 18.5 赞
提升: +90.3%
📈 预测准确度:
平均准确度: 75.5%
MAE: 2.3
⚙️ 策略分布:
learning + insights: 45%
exploration + engagement: 30%
trending + concise: 25%
============================================================
功能详解
1. 运行统计
- 总运行次数
- v3.5 / v3.0 占比
- 权重变化趋势
2. 性能对比
- 平均赞数对比
- 准确度统计
- 预测偏差分析
3. 策略分析
- 策略组合分布
- 探索 vs 利用比例
- 因果分数分布
数据源
默认读取:/tmp/agent_v35_production.log
与其他 Skill 配合
| Skill | 配合方式 | |-------|---------| | v35-monitor-center | 监控数据输入源 | | auto-weekly-system | 周报中嵌入测试数据 | | weekly-report-skill | 生成周期性测试报告 |
更新日志
v1.0.0 (2025-03-26)
- ✅ 基础报告生成
- ✅ v3.5/v3.0 对比分析
- ✅ 策略分布统计
反馈与贡献
如有问题或建议,欢迎反馈。
微信扫一扫