VOC全链路分析看板

概述

本技能提供从原始VOC数据到可执行洞察的完整分析流程。覆盖从数据接入、文本分析、洞察生成到看板输出的全链路，适用于任何需要理解"客户在说什么"的场景。

与客服数据看板的区别：

客服数据看板 = 运营效率指标（工单量、响应时长、客服绩效）
VOC分析看板 = 客户声音洞察（说了什么、痛点是什么、情感如何、趋势怎样）

触发场景

当用户提到以下任何内容时触发本技能：

VOC分析 / 客户声音分析 / 用户反馈分析
生成VOC看板 / VOC dashboard
分析App评价 / 问卷开放题 / 客服工单备注
用户痛点聚类 / 情感趋势分析
NPS文本分析 / 满意度开放意见分析
社交媒体舆情分析（用户反馈维度）

全链路分析工作流

整个分析流程分为四个阶段，按顺序执行。每个阶段产出明确的产物，作为下一阶段的输入。

阶段1：数据接入与结构化

目标： 将分散在多源的VOC数据统一为结构化数据集。

支持的数据源：

| 数据源 | 接入方式 | 注意事项 | |--------|----------|---------| | Excel/CSV本地文件 | 直接读取 | 自动探测编码（UTF-8/GBK） | | 腾讯文档（表格） | mcp__tencent-docs__sheet 工具 | 通过sheet API读取 | | 腾讯文档（文档/智能文档） | mcp__tencent-docs__get_content | 提取文字内容 | | API接口 | WebFetch 或 Bash(curl) | 需要用户提供接口文档 | | 非结构化文本 | 直接粘贴或上传txt/docx | 按段落/条目分割 |

标准化输出字段（尽可能映射）：

至少包含以下字段中的3个，字段名可映射：

- id: 唯一标识
- date: 反馈日期（YYYY-MM-DD）
- source: 数据来源（App Store/客服工单/问卷/社交媒体等）
- channel: 接触渠道（如有）
- content: 反馈正文（核心字段）
- rating: 评分/星级（如有，1-5或1-10）
- sentiment_raw: 原始情感标注（如有）
- user_type: 用户类型（新/老/付费等，如有）
- product: 关联产品/功能（如有）
- status: 处理状态（如有）
- assignee: 负责人（如有）

执行步骤：

询问用户数据位置和格式（如果用户未提供）
读取数据，探测字段结构
将源字段映射至标准字段
输出数据概览：记录数、时间范围、来源分布、字段完整度

阶段2：文本分析与主题提取

目标： 对非结构化的content字段进行深度分析，提取可操作的洞察。

核心分析维度：

2.1 主题聚类（Topic Mining）

从反馈中自动识别高频主题和痛点类别。

操作方法：

对于少量数据（<500条）：直接通读，手动归纳主题
对于大量数据（≥500条）：先通读样本（50-100条）建立主题框架，再批量归类
主题层级：先分大类（如"功能问题""体验问题""价格问题"），再分小类

输出格式：

## 主题分布
- 主题A（占比XX%）：典型表述、出现频次、情感倾向
- 主题B（占比XX%）：...

2.2 情感分析（Sentiment Analysis）

对每条反馈进行情感标注，支持多维度：

整体情感：正向 / 中性 / 负向
情感强度：弱 / 中 / 强（基于用词激烈程度）
情感变化：对比不同时间段的情感分布

中文情感判断参考：

正向关键词：好用、方便、喜欢、推荐、满意、超出预期
负向关键词：卡顿、闪退、难用、贵、投诉、卸载、失望
中性：询问类、建议类（无明显情感倾向）

2.3 关键词与短语提取

提取高频词、短语和新兴话题。

操作方法：

分词后统计词频（排除停用词）
关注"突然增多"的关键词（可能是新问题的信号）
提取用户原话中的生动表述（用于报告引用）

2.4 问题严重度评分

对识别出的问题按影响范围×严重程度评分，用于优先级排序。

评分矩阵：

          影响人数少    影响人数中等    影响人数多
影响小       P3            P3            P2
影响中       P3            P2            P1
影响大       P2            P1            P0

阶段3：趋势分析与行动闭环

目标： 将静态分析转化为动态洞察和可追踪的行动项。

3.1 时间趋势分析

量趋势：每日/每周反馈量变化，识别异常峰值
情感趋势：情感分布随时间的变化，判断改进效果
主题趋势：各主题占比的时间变化，识别新兴问题
NPS/评分趋势（如有评分字段）：平均分随时间变化

3.2 细分维度对比

按来源对比（App Store vs 客服工单：说的内容是否一致？）
按用户类型对比（新用户 vs 老用户：痛点是否不同？）
按产品/功能对比（如有product字段）

3.3 行动闭环设计

将分析结果转化为可追踪的行动项。在看板中包含以下模块：

┌─────────────────────────────────────┐
│ VOC行动闭环看板                      │
├──────────┬──────────┬───────────────┤
│ 发现问题  │ 分析根因  │ 改进措施      │
│ [主题A]  │ [根因X]  │ [措施1/2/3]  │
│ [主题B]  │ [根因Y]  │ [措施...]    │
├──────────┼──────────┼───────────────┤
│ 负责人   │ 截止日期  │ 验证方式      │
│ [姓名]   │ [日期]   │ [跟踪指标]    │
└──────────┴──────────┴───────────────┘

闭环追踪字段建议：

问题ID（关联原始主题）
改进措施描述
负责人
计划完成日期
实际完成日期
验证结果（重新分析同类反馈，看是否减少）
状态（待处理/进行中/已上线/已验证）

阶段4：看板生成与输出

目标： 将分析结果以最适合用户需求的形式输出。

输出格式选择逻辑

用户是否指定了输出格式？
├── 是 → 使用用户指定的格式
└── 否 → 根据数据特点和建议自动选择
    ├── 数据量大（>1000条）+ 需要持续查看 → HTML交互式看板
    ├── 需要与团队协作文档 → 腾讯文档（智能文档或表格）
    ├── 需要向管理层汇报 → PowerPoint报告
    └── 数据量小 + 快速洞察 → 直接在对话中输出分析报告

4.1 HTML交互式看板

适用场景： 数据量大、需要持续/重复查看、需要筛选交互

看板应包含的核心模块（按优先级）：

总览页
- 反馈总量、时间范围
- 情感分布饼图（正向/中性/负向）
- 来源分布
- 时间趋势折线图（反馈量+NPS/评分）
主题洞察页
- 主题分布柱状图/树图
- 每个主题的情感分布
- 点击主题可下钻查看原始反馈样本
趋势分析页
- 情感趋势时间序列
- 主题演变时间序列
- 异常峰值标注（可点击查看当日具体反馈）
行动闭环页
- 问题优先级矩阵（影响×严重度）
- 行动项追踪表（可更新状态）

技术实现：

使用 assets/dashboard_template.html 作为基础模板
图表使用 Chart.js 或 ECharts（通过CDN引入）
数据嵌入为JSON，无需后端
确保中文显示正常（中文字体栈）

4.2 腾讯文档输出

适用场景： 需要团队协作、在线更新、权限管理

两种形式：

智能文档：适合分析报告（文字+图表+洞察结论）
智能表格：适合数据结构化展示（可按来源/主题/时间筛选）

操作方法：

使用 mcp__tencent-docs 工具创建文档
先创建文档，再分段插入内容
图表使用 mcp__tencent-docs__create_flowchart_by_mermaid 或插入图片

4.3 PowerPoint报告

适用场景： 向管理层汇报、周期性总结（月度/季度VOC报告）

建议结构（10-15页）：

封面（VOC分析报告 + 时间范围 + 数据来源）
执行摘要（3-5条核心发现）
数据概览（量、来源分布、响应率等）
情感总览（整体情感分布 + 同比/环比）
核心痛点Top5（每个痛点：描述、占比、典型原话、趋势）
新兴问题预警（近期增多的主题）
正向反馈亮点（用户喜欢什么，用于强化）
行动建议（按优先级）
附录：方法论说明

操作方法：

使用 pptx skill 生成PPT
或先生成HTML报告，再转换为PDF/PPT

4.4 直接分析报告（对话输出）

适用场景： 数据量小（<200条）、快速洞察需求

输出格式：

结构化Markdown报告
包含核心图表（使用 show_widget 工具生成可视化）
包含原始反馈样本引用
包含具体行动建议

行业适配指南

本技能不绑定特定行业，但不同行业的VOC分析重点不同。分析时参考以下行业特点调整分析重点：

电商/零售

重点关注：物流体验、商品质量、售后服务、价格感知
典型来源：App评价、客服工单、售后退款备注
特有指标：退货率关联分析、复购意向表达

SaaS/软件

重点关注：功能缺失、Bug反馈、易用性、学习成本
典型来源：应用内反馈、客服工单、NPS开放题、社区论坛
特有指标：功能请求频次、Bug影响用户数

金融/支付

重点关注：安全性感知、交易失败、客服响应、费用透明
典型来源：客服工单、投诉渠道、App评价
特有指标：合规相关反馈、情感强烈度（金融问题情感更强烈）

出行/旅游

重点关注：预订体验、行程变更、退款政策、客服可达性
典型来源：App评价、客服工单、社交媒体
特有指标：季节性波动（节假日高峰）、紧急问题响应

通用适配原则

如果用户未说明行业，先通读数据样本判断行业特征
分析框架保持不变，但主题词典和关注重点随行业调整
在输出中注明"基于XX行业特点，重点关注了..."

执行检查清单

完成分析后，对照以下清单确保质量：

数据完整性：

[ ] 已确认数据时间范围和记录总数
[ ] 已处理缺失字段（标注而非忽略）
[ ] 已识别并标注异常数据（刷评、重复反馈等）

分析深度：

[ ] 已提取至少5个核心主题
[ ] 已进行情感分析并验证准确性（抽样检查）
[ ] 已识别时间趋势和异常峰值
[ ] 已将发现转化为具体行动建议

输出质量：

[ ] 看板/报告包含数据概览、核心洞察、行动建议三大部分
[ ] 所有图表都有清晰标题和数据标注
[ ] 包含用户原话引用（增强说服力）
[ ] 行动建议按优先级排序，且具体可操作

资源文件说明

scripts/

包含可执行的Python脚本，用于批量数据处理和看板生成。

voc_text_analyzer.py：批量文本分析脚本，支持情感分析、关键词提取、主题聚类
dashboard_generator.py：从结构化分析结果生成HTML看板的脚本

references/

包含详细的方法论文档和行业参考。

analysis_framework.md：VOC分析的方法论详解，包含指标定义、采样方法、偏差修正
industry_templates.md：各行业VOC分析的重点主题词典和报告模板参考

assets/

包含输出模板文件。

dashboard_template.html：HTML看板的基础模板，包含Chart.js引入和响应式布局

注意事项

数据隐私：VOC数据可能包含用户个人信息，输出时注意脱敏（隐藏用户名、订单号等）
样本偏差：App评价通常是极端情感（非常满意/非常不满意），需结合其他来源综合判断
刷评识别：注意识别疑似刷评内容（重复表述、发布时间集中、内容与产品无关）
行动可行性：提出的行动建议需考虑成本和技术可行性，标注实施难度
持续追踪：VOC分析不是一次性工作，建议建立周期性分析机制（参考cx-data-dashboard技能的自动更新能力）

VOC 全链路分析看板

VOC全链路分析看板

概述

触发场景

全链路分析工作流

阶段1：数据接入与结构化

阶段2：文本分析与主题提取

2.1 主题聚类（Topic Mining）

2.2 情感分析（Sentiment Analysis）

2.3 关键词与短语提取

2.4 问题严重度评分

阶段3：趋势分析与行动闭环

3.1 时间趋势分析

3.2 细分维度对比

3.3 行动闭环设计

阶段4：看板生成与输出

输出格式选择逻辑

4.1 HTML交互式看板

4.2 腾讯文档输出

4.3 PowerPoint报告

4.4 直接分析报告（对话输出）

行业适配指南

电商/零售

SaaS/软件

金融/支付

出行/旅游

通用适配原则

执行检查清单

资源文件说明

scripts/

references/

assets/

注意事项