返回 Skill 列表
extension
分类: 开发与工程无需 API Key

OCR 财务提取 Skill

面向 AI PC 的本地发票 OCR 财务提取 Skill,支持批量识别发票图片/PDF,抽取发票代码、号码、日期、购销方、金额、税额和价税合计,导出 JSON/CSV/XLSX,并生成重复发票、金额不一致、缺失字段等复核清单。默认使用 RapidOCR + OpenVINO 本地推理,并包含 INT8 量化实验后端。

person作者: WEIAIbhubModelScope

批量发票 OCR 财务提取 Skill

适用场景

当用户需要批量识别本地发票、生成报销台账、检查发票字段或找出财务异常时,调用本 Skill。

典型请求:

  • 识别某个目录下的所有发票并导出 Excel。
  • 找出重复发票号码。
  • 找出金额、税额、价税合计不一致的发票。
  • 列出低置信度字段,方便人工复核。

输入

  • --input:本地输入目录或单个文件路径,支持 jpg/jpeg/png/pdf
  • --output:输出目录。
  • --format:导出格式,支持 json,csv,xlsx
  • --review-threshold:低置信度复核阈值,默认 0.85
  • --ocr-backend:OCR 后端,支持 rapidocr-openvinorapidocr-openvino-int8rapidocr-openvino-int8-clsrapidocrsidecar,默认推荐 rapidocr-openvino

调用

python -m skill.invoice_ocr.cli --input ".\samples\input" --output ".\runs\openvino-demo" --format "json,csv,xlsx" --review-threshold 0.85 --ocr-backend rapidocr-openvino

推荐在本项目目录执行:

cd "D:\AI PC Agent Skills\invoice-ocr-finance-skill"
..\.venv\Scripts\python.exe -m skill.invoice_ocr.cli --input ".\samples\public\fuxijia_vat" --output ".\runs\public-vat-openvino" --format "json,csv,xlsx" --ocr-backend rapidocr-openvino

输出

  • results.json:结构化字段、置信度和异常信息。
  • results.csv:财务台账。
  • results.xlsx:Excel 台账。
  • review_items.json:需要人工复核的文件和字段。

注意事项

  • 本 Skill 默认只读取本地文件,不上传云端。
  • 默认不删除、不移动原始发票文件。
  • 当 OCR 字段缺失或置信度低时,应在最终回复中提示用户复核。
  • 优先使用 rapidocr-openvino,除非 OpenVINO 初始化失败再切回 rapidocr
  • rapidocr-openvino-int8rapidocr-openvino-int8-cls 是实验后端,适合验证权重量化效果;正式财务抽取优先使用 rapidocr-openvino,因为当前公开 VAT 样例显示 INT8 识别行数有下降。

Agent 回复要求

调用完成后,Agent 应读取输出目录中的:

  • results.json:汇总处理文件数、抽取字段和平均置信度。
  • review_items.json:优先报告需要人工复核的问题。

最终回复应包含:

  • 输出目录。
  • 处理文件数。
  • 成功抽取的关键字段概览。
  • 重复发票号、金额不一致、缺失字段等异常。
  • 若存在复核项,明确提示人工复核。