数据你问我答
概述
本技能提供零技术门槛的个人数据管理与智能问答分析服务。用户通过多种方式录入数据后,AI自动完成数据存储、唯一性校验、标签分类和索引建立。用户可通过自然语言查询数据、生成统计分析和可视化图表,无需任何数据库操作知识。
核心能力
1. 多模态数据录入
支持六种数据录入方式,所有方式遵循统一流程:解析数据 → 唯一性查重 → 判定处理 → 入库反馈
| 录入方式 | 说明 | 触发关键词 | |---------|------|-----------| | 文字录入 | 直接口语化输入数据 | "记录今天消费100元"、"录入数据" | | 语音录入 | 语音转文字后解析 | "语音录入"、"我说你记" | | 拍照/图片 | OCR识别发票、小票、截图 | "拍照录入"、"识别这张发票" | | Excel导入 | 批量导入.xlsx/.xls文件 | "导入Excel"、"批量导入" | | CSV导入 | 导入CSV格式数据 | "导入CSV" | | 对接数据库 | 连接外部数据库读取数据 | "对接数据库"、"连接数据库" |
2. 智能数据存储
- 本地独立数据库:数据存储完全脱离技能目录,物理隔离保障安全
- AI自主建库建表:根据数据内容自动决策数据库结构,用户无感知
- 唯一性保障:每张表强制设置主键,入库前自动查重,杜绝重复数据
3. 智能标签体系
预设标签(生活消费类):
- 餐饮美食、交通出行、居家日用、医疗健康、休闲娱乐、水电缴费
预设标签(经营数据类):
- 销售营收、采购成本、营销费用、员工薪酬
AI动态标签:
- 自动细分二级标签(如餐饮→商务宴请、日常就餐)
- 动态聚合标签响应泛化提问(日常支出=餐饮+交通+居家)
- 支持用户手动修改/追加标签
4. 数据查询与分析
基础查询:
- 单条数据查询:"查询3月15日的餐饮消费"
- 条件筛选:"显示本月所有交通支出"
统计运算:
- 聚合计算:"本月餐饮总共花了多少钱"
- 同比环比:"这个月支出比上个月增长多少"
- 极值统计:"今年最大的一笔消费是多少"
可视化生成:
- 趋势图:"生成月度消费趋势图"
- 对比图:"对比各月份餐饮支出"
智能分析:
- 趋势分析:"分析我的消费习惯变化"
- 异常提示:"指出消费异常的时间段"
- 建议输出:"给出下月消费预算建议"
工作流程
数据录入流程
用户选择录入方式
↓
AI解析数据内容(时间、金额、类型、备注等)
↓
执行唯一性查重校验
↓
├─ 重复数据 → 拦截并提示"该数据已存在,是否重新入库?"
└─ 非重复数据 → 继续
↓
AI自主判断并执行:
- 创建/选择数据库
- 创建/匹配数据表结构
- 生成唯一主键
- 自动打标签
- 建立索引
↓
静默入库
↓
用户反馈:"数据录入成功,已分类为[标签]"
数据查询流程
用户自然语言提问
↓
语义解析匹配标签/索引
↓
从数据库调取去重后的有效数据
↓
执行运算分析/图表生成
↓
返回结果+分析建议
数据安全与唯一性保障
安全机制
- 物理隔离:数据库本地独立部署,脱离技能目录
- 权限控制:技能仅有数据读写权限,无删除/迁移权限
- 数据加密:敏感信息自动脱敏,传输加密
- 临时清理:运行结束后自动清空临时缓存
唯一性保障
- 主键约束:每张表强制设置唯一主键
- 查重逻辑:入库前根据"时间+业务标签+核心数值"双重校验
- 重复拦截:发现重复数据时提示用户确认,避免误入库
使用示例
示例1:文字录入消费数据
用户:"昨天午餐花了35元,在肯德基"
执行:
- 解析:时间=昨天,金额=35元,类型=餐饮,商户=肯德基
- 查重:检查是否已存在相同记录
- 入库:生成主键,打标签"餐饮美食-日常就餐"
- 反馈:"已记录昨日餐饮消费35元"
示例2:Excel批量导入
用户:"导入这个月的消费记录Excel文件"
执行:
- 用户上传Excel文件
- AI解析表头和数据内容
- 批量查重每一条记录
- 重复数据列清单供用户确认
- 非重复数据自动入库并分类
- 反馈:"成功导入45条记录,跳过3条重复数据"
示例3:数据查询
用户:"这个月吃饭花了多少钱"
执行:
- 语义解析:时间=本月,标签=餐饮美食
- 查询数据库:筛选时间索引+标签索引
- 聚合计算:SUM(金额)
- 反馈:"本月餐饮消费总计1,250元,较上月增长15%"
示例4:生成图表
用户:"生成今年各月份支出对比图"
执行:
- 解析:时间范围=今年1-12月,指标=支出金额
- 查询:按月分组聚合
- 生成:柱状对比图+趋势分析
- 反馈:图表+"支出高峰在11月(双十一),低谷在2月"
文件与资源
数据库位置
数据库存储路径:~/.workbuddy/data/data-qa/
- 与用户技能目录完全隔离
- 本地SQLite数据库,加密存储
- 支持多用户数据隔离
内置脚本
scripts/database_manager.py:数据库连接、建库建表、CRUD操作scripts/data_parser.py:多模态数据解析(OCR、Excel、CSV等)scripts/query_engine.py:查询解析、统计运算、图表生成scripts/deduplication.py:重复数据检测与处理
参考资料
references/database_schema.md:数据库结构参考references/tag_system.md:标签体系与映射规则references/api_guide.md:内部API使用指南
注意事项
- 首次使用:首次录入数据时自动初始化数据库,无需手动配置
- 数据备份:建议定期备份
~/.workbuddy/data/data-qa/目录 - 隐私保护:本技能所有数据处理均在本地完成,不上传云端
- 重复处理:遇到疑似重复数据时会提示确认,避免误删
扩展功能
- 数据导出:支持导出Excel/CSV格式
- 批量修改:支持标签批量修改
- 数据清理:支持删除单条记录或批量清理
- 多库联动:支持跨数据库数据整合分析(规划中)
微信扫一扫