VOC全链路分析看板
概述
本技能提供从原始VOC数据到可执行洞察的完整分析流程。覆盖从数据接入、文本分析、洞察生成到看板输出的全链路,适用于任何需要理解"客户在说什么"的场景。
与客服数据看板的区别:
- 客服数据看板 = 运营效率指标(工单量、响应时长、客服绩效)
- VOC分析看板 = 客户声音洞察(说了什么、痛点是什么、情感如何、趋势怎样)
触发场景
当用户提到以下任何内容时触发本技能:
- VOC分析 / 客户声音分析 / 用户反馈分析
- 生成VOC看板 / VOC dashboard
- 分析App评价 / 问卷开放题 / 客服工单备注
- 用户痛点聚类 / 情感趋势分析
- NPS文本分析 / 满意度开放意见分析
- 社交媒体舆情分析(用户反馈维度)
全链路分析工作流
整个分析流程分为四个阶段,按顺序执行。每个阶段产出明确的产物,作为下一阶段的输入。
阶段1:数据接入与结构化
目标: 将分散在多源的VOC数据统一为结构化数据集。
支持的数据源:
| 数据源 | 接入方式 | 注意事项 |
|--------|----------|---------|
| Excel/CSV本地文件 | 直接读取 | 自动探测编码(UTF-8/GBK) |
| 腾讯文档(表格) | mcp__tencent-docs__sheet 工具 | 通过sheet API读取 |
| 腾讯文档(文档/智能文档) | mcp__tencent-docs__get_content | 提取文字内容 |
| API接口 | WebFetch 或 Bash(curl) | 需要用户提供接口文档 |
| 非结构化文本 | 直接粘贴或上传txt/docx | 按段落/条目分割 |
标准化输出字段(尽可能映射):
至少包含以下字段中的3个,字段名可映射:
- id: 唯一标识
- date: 反馈日期(YYYY-MM-DD)
- source: 数据来源(App Store/客服工单/问卷/社交媒体等)
- channel: 接触渠道(如有)
- content: 反馈正文(核心字段)
- rating: 评分/星级(如有,1-5或1-10)
- sentiment_raw: 原始情感标注(如有)
- user_type: 用户类型(新/老/付费等,如有)
- product: 关联产品/功能(如有)
- status: 处理状态(如有)
- assignee: 负责人(如有)
执行步骤:
- 询问用户数据位置和格式(如果用户未提供)
- 读取数据,探测字段结构
- 将源字段映射至标准字段
- 输出数据概览:记录数、时间范围、来源分布、字段完整度
阶段2:文本分析与主题提取
目标: 对非结构化的content字段进行深度分析,提取可操作的洞察。
核心分析维度:
2.1 主题聚类(Topic Mining)
从反馈中自动识别高频主题和痛点类别。
操作方法:
- 对于少量数据(<500条):直接通读,手动归纳主题
- 对于大量数据(≥500条):先通读样本(50-100条)建立主题框架,再批量归类
- 主题层级:先分大类(如"功能问题""体验问题""价格问题"),再分小类
输出格式:
## 主题分布
- 主题A(占比XX%):典型表述、出现频次、情感倾向
- 主题B(占比XX%):...
2.2 情感分析(Sentiment Analysis)
对每条反馈进行情感标注,支持多维度:
- 整体情感:正向 / 中性 / 负向
- 情感强度:弱 / 中 / 强(基于用词激烈程度)
- 情感变化:对比不同时间段的情感分布
中文情感判断参考:
- 正向关键词:好用、方便、喜欢、推荐、满意、超出预期
- 负向关键词:卡顿、闪退、难用、贵、投诉、卸载、失望
- 中性:询问类、建议类(无明显情感倾向)
2.3 关键词与短语提取
提取高频词、短语和新兴话题。
操作方法:
- 分词后统计词频(排除停用词)
- 关注"突然增多"的关键词(可能是新问题的信号)
- 提取用户原话中的生动表述(用于报告引用)
2.4 问题严重度评分
对识别出的问题按影响范围×严重程度评分,用于优先级排序。
评分矩阵:
影响人数少 影响人数中等 影响人数多
影响小 P3 P3 P2
影响中 P3 P2 P1
影响大 P2 P1 P0
阶段3:趋势分析与行动闭环
目标: 将静态分析转化为动态洞察和可追踪的行动项。
3.1 时间趋势分析
- 量趋势:每日/每周反馈量变化,识别异常峰值
- 情感趋势:情感分布随时间的变化,判断改进效果
- 主题趋势:各主题占比的时间变化,识别新兴问题
- NPS/评分趋势(如有评分字段):平均分随时间变化
3.2 细分维度对比
- 按来源对比(App Store vs 客服工单:说的内容是否一致?)
- 按用户类型对比(新用户 vs 老用户:痛点是否不同?)
- 按产品/功能对比(如有product字段)
3.3 行动闭环设计
将分析结果转化为可追踪的行动项。在看板中包含以下模块:
┌─────────────────────────────────────┐
│ VOC行动闭环看板 │
├──────────┬──────────┬───────────────┤
│ 发现问题 │ 分析根因 │ 改进措施 │
│ [主题A] │ [根因X] │ [措施1/2/3] │
│ [主题B] │ [根因Y] │ [措施...] │
├──────────┼──────────┼───────────────┤
│ 负责人 │ 截止日期 │ 验证方式 │
│ [姓名] │ [日期] │ [跟踪指标] │
└──────────┴──────────┴───────────────┘
闭环追踪字段建议:
- 问题ID(关联原始主题)
- 改进措施描述
- 负责人
- 计划完成日期
- 实际完成日期
- 验证结果(重新分析同类反馈,看是否减少)
- 状态(待处理/进行中/已上线/已验证)
阶段4:看板生成与输出
目标: 将分析结果以最适合用户需求的形式输出。
输出格式选择逻辑
用户是否指定了输出格式?
├── 是 → 使用用户指定的格式
└── 否 → 根据数据特点和建议自动选择
├── 数据量大(>1000条)+ 需要持续查看 → HTML交互式看板
├── 需要与团队协作文档 → 腾讯文档(智能文档或表格)
├── 需要向管理层汇报 → PowerPoint报告
└── 数据量小 + 快速洞察 → 直接在对话中输出分析报告
4.1 HTML交互式看板
适用场景: 数据量大、需要持续/重复查看、需要筛选交互
看板应包含的核心模块(按优先级):
-
总览页
- 反馈总量、时间范围
- 情感分布饼图(正向/中性/负向)
- 来源分布
- 时间趋势折线图(反馈量+NPS/评分)
-
主题洞察页
- 主题分布柱状图/树图
- 每个主题的情感分布
- 点击主题可下钻查看原始反馈样本
-
趋势分析页
- 情感趋势时间序列
- 主题演变时间序列
- 异常峰值标注(可点击查看当日具体反馈)
-
行动闭环页
- 问题优先级矩阵(影响×严重度)
- 行动项追踪表(可更新状态)
技术实现:
- 使用
assets/dashboard_template.html作为基础模板 - 图表使用 Chart.js 或 ECharts(通过CDN引入)
- 数据嵌入为JSON,无需后端
- 确保中文显示正常(中文字体栈)
4.2 腾讯文档输出
适用场景: 需要团队协作、在线更新、权限管理
两种形式:
- 智能文档:适合分析报告(文字+图表+洞察结论)
- 智能表格:适合数据结构化展示(可按来源/主题/时间筛选)
操作方法:
- 使用
mcp__tencent-docs工具创建文档 - 先创建文档,再分段插入内容
- 图表使用
mcp__tencent-docs__create_flowchart_by_mermaid或插入图片
4.3 PowerPoint报告
适用场景: 向管理层汇报、周期性总结(月度/季度VOC报告)
建议结构(10-15页):
- 封面(VOC分析报告 + 时间范围 + 数据来源)
- 执行摘要(3-5条核心发现)
- 数据概览(量、来源分布、响应率等)
- 情感总览(整体情感分布 + 同比/环比)
- 核心痛点Top5(每个痛点:描述、占比、典型原话、趋势)
- 新兴问题预警(近期增多的主题)
- 正向反馈亮点(用户喜欢什么,用于强化)
- 行动建议(按优先级)
- 附录:方法论说明
操作方法:
- 使用
pptxskill 生成PPT - 或先生成HTML报告,再转换为PDF/PPT
4.4 直接分析报告(对话输出)
适用场景: 数据量小(<200条)、快速洞察需求
输出格式:
- 结构化Markdown报告
- 包含核心图表(使用
show_widget工具生成可视化) - 包含原始反馈样本引用
- 包含具体行动建议
行业适配指南
本技能不绑定特定行业,但不同行业的VOC分析重点不同。分析时参考以下行业特点调整分析重点:
电商/零售
- 重点关注:物流体验、商品质量、售后服务、价格感知
- 典型来源:App评价、客服工单、售后退款备注
- 特有指标:退货率关联分析、复购意向表达
SaaS/软件
- 重点关注:功能缺失、Bug反馈、易用性、学习成本
- 典型来源:应用内反馈、客服工单、NPS开放题、社区论坛
- 特有指标:功能请求频次、Bug影响用户数
金融/支付
- 重点关注:安全性感知、交易失败、客服响应、费用透明
- 典型来源:客服工单、投诉渠道、App评价
- 特有指标:合规相关反馈、情感强烈度(金融问题情感更强烈)
出行/旅游
- 重点关注:预订体验、行程变更、退款政策、客服可达性
- 典型来源:App评价、客服工单、社交媒体
- 特有指标:季节性波动(节假日高峰)、紧急问题响应
通用适配原则
- 如果用户未说明行业,先通读数据样本判断行业特征
- 分析框架保持不变,但主题词典和关注重点随行业调整
- 在输出中注明"基于XX行业特点,重点关注了..."
执行检查清单
完成分析后,对照以下清单确保质量:
数据完整性:
- [ ] 已确认数据时间范围和记录总数
- [ ] 已处理缺失字段(标注而非忽略)
- [ ] 已识别并标注异常数据(刷评、重复反馈等)
分析深度:
- [ ] 已提取至少5个核心主题
- [ ] 已进行情感分析并验证准确性(抽样检查)
- [ ] 已识别时间趋势和异常峰值
- [ ] 已将发现转化为具体行动建议
输出质量:
- [ ] 看板/报告包含数据概览、核心洞察、行动建议三大部分
- [ ] 所有图表都有清晰标题和数据标注
- [ ] 包含用户原话引用(增强说服力)
- [ ] 行动建议按优先级排序,且具体可操作
资源文件说明
scripts/
包含可执行的Python脚本,用于批量数据处理和看板生成。
voc_text_analyzer.py:批量文本分析脚本,支持情感分析、关键词提取、主题聚类dashboard_generator.py:从结构化分析结果生成HTML看板的脚本
references/
包含详细的方法论文档和行业参考。
analysis_framework.md:VOC分析的方法论详解,包含指标定义、采样方法、偏差修正industry_templates.md:各行业VOC分析的重点主题词典和报告模板参考
assets/
包含输出模板文件。
dashboard_template.html:HTML看板的基础模板,包含Chart.js引入和响应式布局
注意事项
- 数据隐私:VOC数据可能包含用户个人信息,输出时注意脱敏(隐藏用户名、订单号等)
- 样本偏差:App评价通常是极端情感(非常满意/非常不满意),需结合其他来源综合判断
- 刷评识别:注意识别疑似刷评内容(重复表述、发布时间集中、内容与产品无关)
- 行动可行性:提出的行动建议需考虑成本和技术可行性,标注实施难度
- 持续追踪:VOC分析不是一次性工作,建议建立周期性分析机制(参考
cx-data-dashboard技能的自动更新能力)
Scan to join WeChat group