文档 OCR 识别技能
批量识别文档。
⚠️ 首次使用必须配置凭证
此技能需要翔云 OCR 服务,使用前必须先配置凭证!
方式一:向用户提供凭证(推荐)
主动询问用户:
"使用此技能需要翔云 netocr_key 和 netocr_secret,请提供这两个凭证。
获取方式:翔云个人中心"
然后运行:
python scripts/recognize_doc.py --config
方式二:引导用户自行配置
告诉用户:
"请先运行以下命令配置翔云凭证:"
python ~/.openclaw/skills/invoice-ocr/scripts/recognize_doc.py --config
特点
| 支持语言 | 代码 | | :------- | :------- | | 简体中文(印刷) | 0 | | 简体中文(印刷+手写) | 3 | | 繁体中文(印刷) | 1 | | 繁体中文(印刷+手写) | 4 | | 英文 | 2 | | 阿拉伯 | 5 | | 乌尔都 | 6 | | 格鲁吉亚 | 7 | | 西里尔文 | 8 | | 法文 | 9 | | 西班牙文 | 10 | | 日文 | 11 | | 韩文 | 12 | | 葡萄牙文 | 13 | | 越南 | 14 | | 孟加拉 | 15 |
支持的文件格式
| 格式 | 扩展名 | |------|--------| | PDF | .pdf | | OFD | .ofd | | 图片 | .jpg, .jpeg, .png, .bmp , .tif, .tiff, .webp |
使用方法
识别文档
# 识别文件夹中的所有文档
python scripts/recognize_doc.py /path/to/doc
# 识别单文档
python scripts/recognize_doc.py /path/to/doc/123.png
配置管理
# 设置翔云凭证
python scripts/recognize_doc.py --config
# 查看当前配置
python scripts/recognize_doc.py --list-config
获取 netocr_key 和 netocr_secret
- 登录翔云
- 在个人中心获得
详细 API 说明见 翔云 OCR API 参考
工作流程
文档文件 → OCR识别 → 返回结果(输出原文不必翻译)
↓ ↓
PDF/图片 md结构
注意事项
- 图片需清晰,建议长宽 > 500px
- 单个文件不超过 10MB
- 翔云 OCR 按次计费,注意费用控制
- 配置文件保存在技能目录下的 config.json
扫码联系在线客服