批量发票 OCR 财务提取 Skill
适用场景
当用户需要批量识别本地发票、生成报销台账、检查发票字段或找出财务异常时,调用本 Skill。
典型请求:
- 识别某个目录下的所有发票并导出 Excel。
- 找出重复发票号码。
- 找出金额、税额、价税合计不一致的发票。
- 列出低置信度字段,方便人工复核。
输入
--input:本地输入目录或单个文件路径,支持jpg/jpeg/png/pdf。--output:输出目录。--format:导出格式,支持json,csv,xlsx。--review-threshold:低置信度复核阈值,默认0.85。--ocr-backend:OCR 后端,支持rapidocr-openvino、rapidocr-openvino-int8、rapidocr-openvino-int8-cls、rapidocr、sidecar,默认推荐rapidocr-openvino。
调用
python -m skill.invoice_ocr.cli --input ".\samples\input" --output ".\runs\openvino-demo" --format "json,csv,xlsx" --review-threshold 0.85 --ocr-backend rapidocr-openvino
推荐在本项目目录执行:
cd "D:\AI PC Agent Skills\invoice-ocr-finance-skill"
..\.venv\Scripts\python.exe -m skill.invoice_ocr.cli --input ".\samples\public\fuxijia_vat" --output ".\runs\public-vat-openvino" --format "json,csv,xlsx" --ocr-backend rapidocr-openvino
输出
results.json:结构化字段、置信度和异常信息。results.csv:财务台账。results.xlsx:Excel 台账。review_items.json:需要人工复核的文件和字段。
注意事项
- 本 Skill 默认只读取本地文件,不上传云端。
- 默认不删除、不移动原始发票文件。
- 当 OCR 字段缺失或置信度低时,应在最终回复中提示用户复核。
- 优先使用
rapidocr-openvino,除非 OpenVINO 初始化失败再切回rapidocr。 rapidocr-openvino-int8和rapidocr-openvino-int8-cls是实验后端,适合验证权重量化效果;正式财务抽取优先使用rapidocr-openvino,因为当前公开 VAT 样例显示 INT8 识别行数有下降。
Agent 回复要求
调用完成后,Agent 应读取输出目录中的:
results.json:汇总处理文件数、抽取字段和平均置信度。review_items.json:优先报告需要人工复核的问题。
最终回复应包含:
- 输出目录。
- 处理文件数。
- 成功抽取的关键字段概览。
- 重复发票号、金额不一致、缺失字段等异常。
- 若存在复核项,明确提示人工复核。
扫码联系在线客服