Back to skills
extension
Category: Data & AnalyticsNo API key required

数据你问我答

个人数据管理与智能问答分析工具。支持文字、语音、拍照、Excel/CSV导入、对接数据库等多种方式录入数据,实现数据存储、唯一性校验、自动运算、精准查询、可视化生成与智能分析。适用于个人消费记账、经营数据台账、业绩数据管理等场景。当用户需要记录数据、查询统计、生成图表或分析数据趋势时触发此技能。

personAuthor: user_1002ca6ahubcommunity

数据你问我答

概述

本技能提供零技术门槛的个人数据管理与智能问答分析服务。用户通过多种方式录入数据后,AI自动完成数据存储、唯一性校验、标签分类和索引建立。用户可通过自然语言查询数据、生成统计分析和可视化图表,无需任何数据库操作知识。

核心能力

1. 多模态数据录入

支持六种数据录入方式,所有方式遵循统一流程:解析数据 → 唯一性查重 → 判定处理 → 入库反馈

| 录入方式 | 说明 | 触发关键词 | |---------|------|-----------| | 文字录入 | 直接口语化输入数据 | "记录今天消费100元"、"录入数据" | | 语音录入 | 语音转文字后解析 | "语音录入"、"我说你记" | | 拍照/图片 | OCR识别发票、小票、截图 | "拍照录入"、"识别这张发票" | | Excel导入 | 批量导入.xlsx/.xls文件 | "导入Excel"、"批量导入" | | CSV导入 | 导入CSV格式数据 | "导入CSV" | | 对接数据库 | 连接外部数据库读取数据 | "对接数据库"、"连接数据库" |

2. 智能数据存储

  • 本地独立数据库:数据存储完全脱离技能目录,物理隔离保障安全
  • AI自主建库建表:根据数据内容自动决策数据库结构,用户无感知
  • 唯一性保障:每张表强制设置主键,入库前自动查重,杜绝重复数据

3. 智能标签体系

预设标签(生活消费类)

  • 餐饮美食、交通出行、居家日用、医疗健康、休闲娱乐、水电缴费

预设标签(经营数据类)

  • 销售营收、采购成本、营销费用、员工薪酬

AI动态标签

  • 自动细分二级标签(如餐饮→商务宴请、日常就餐)
  • 动态聚合标签响应泛化提问(日常支出=餐饮+交通+居家)
  • 支持用户手动修改/追加标签

4. 数据查询与分析

基础查询

  • 单条数据查询:"查询3月15日的餐饮消费"
  • 条件筛选:"显示本月所有交通支出"

统计运算

  • 聚合计算:"本月餐饮总共花了多少钱"
  • 同比环比:"这个月支出比上个月增长多少"
  • 极值统计:"今年最大的一笔消费是多少"

可视化生成

  • 趋势图:"生成月度消费趋势图"
  • 对比图:"对比各月份餐饮支出"

智能分析

  • 趋势分析:"分析我的消费习惯变化"
  • 异常提示:"指出消费异常的时间段"
  • 建议输出:"给出下月消费预算建议"

工作流程

数据录入流程

用户选择录入方式
    ↓
AI解析数据内容(时间、金额、类型、备注等)
    ↓
执行唯一性查重校验
    ↓
├─ 重复数据 → 拦截并提示"该数据已存在,是否重新入库?"
└─ 非重复数据 → 继续
    ↓
AI自主判断并执行:
  - 创建/选择数据库
  - 创建/匹配数据表结构
  - 生成唯一主键
  - 自动打标签
  - 建立索引
    ↓
静默入库
    ↓
用户反馈:"数据录入成功,已分类为[标签]"

数据查询流程

用户自然语言提问
    ↓
语义解析匹配标签/索引
    ↓
从数据库调取去重后的有效数据
    ↓
执行运算分析/图表生成
    ↓
返回结果+分析建议

数据安全与唯一性保障

安全机制

  1. 物理隔离:数据库本地独立部署,脱离技能目录
  2. 权限控制:技能仅有数据读写权限,无删除/迁移权限
  3. 数据加密:敏感信息自动脱敏,传输加密
  4. 临时清理:运行结束后自动清空临时缓存

唯一性保障

  1. 主键约束:每张表强制设置唯一主键
  2. 查重逻辑:入库前根据"时间+业务标签+核心数值"双重校验
  3. 重复拦截:发现重复数据时提示用户确认,避免误入库

使用示例

示例1:文字录入消费数据

用户:"昨天午餐花了35元,在肯德基"

执行

  1. 解析:时间=昨天,金额=35元,类型=餐饮,商户=肯德基
  2. 查重:检查是否已存在相同记录
  3. 入库:生成主键,打标签"餐饮美食-日常就餐"
  4. 反馈:"已记录昨日餐饮消费35元"

示例2:Excel批量导入

用户:"导入这个月的消费记录Excel文件"

执行

  1. 用户上传Excel文件
  2. AI解析表头和数据内容
  3. 批量查重每一条记录
  4. 重复数据列清单供用户确认
  5. 非重复数据自动入库并分类
  6. 反馈:"成功导入45条记录,跳过3条重复数据"

示例3:数据查询

用户:"这个月吃饭花了多少钱"

执行

  1. 语义解析:时间=本月,标签=餐饮美食
  2. 查询数据库:筛选时间索引+标签索引
  3. 聚合计算:SUM(金额)
  4. 反馈:"本月餐饮消费总计1,250元,较上月增长15%"

示例4:生成图表

用户:"生成今年各月份支出对比图"

执行

  1. 解析:时间范围=今年1-12月,指标=支出金额
  2. 查询:按月分组聚合
  3. 生成:柱状对比图+趋势分析
  4. 反馈:图表+"支出高峰在11月(双十一),低谷在2月"

文件与资源

数据库位置

数据库存储路径:~/.workbuddy/data/data-qa/

  • 与用户技能目录完全隔离
  • 本地SQLite数据库,加密存储
  • 支持多用户数据隔离

内置脚本

  • scripts/database_manager.py:数据库连接、建库建表、CRUD操作
  • scripts/data_parser.py:多模态数据解析(OCR、Excel、CSV等)
  • scripts/query_engine.py:查询解析、统计运算、图表生成
  • scripts/deduplication.py:重复数据检测与处理

参考资料

  • references/database_schema.md:数据库结构参考
  • references/tag_system.md:标签体系与映射规则
  • references/api_guide.md:内部API使用指南

注意事项

  1. 首次使用:首次录入数据时自动初始化数据库,无需手动配置
  2. 数据备份:建议定期备份 ~/.workbuddy/data/data-qa/ 目录
  3. 隐私保护:本技能所有数据处理均在本地完成,不上传云端
  4. 重复处理:遇到疑似重复数据时会提示确认,避免误删

扩展功能

  • 数据导出:支持导出Excel/CSV格式
  • 批量修改:支持标签批量修改
  • 数据清理:支持删除单条记录或批量清理
  • 多库联动:支持跨数据库数据整合分析(规划中)