t-cpm AI强化识图工具使用指南
核心能力
- 自动从
/root/.OpenClaw/workspace/conding-plan-models.json读取模型配置、Base URL、API Key - 关键词三维深度分析:自动生成「核心必须元素、场景特征要求、绝对排除特征」三大类专业判断标准
- 多模态图片识别:支持调用配置文件中的任意多模态大模型进行图片理解
- 严格规则筛选:100%按照生成的判断标准识别图片,不符合要求自动删除/分类
- 批量处理支持:支持单个图片、目录批量处理两种模式
- 结果统计:输出筛选结果统计(总数量、保留数量、删除数量、符合率)
- 可扩展性:内置模块化结构,方便后续拓展自定义规则、分类保存、结果导出等功能
使用流程
当用户需要识别筛选图片时,自动执行以下步骤:
- 从conding-plan-models.json加载配置,选择指定的模型(默认使用doubao-seed-2.0-pro)
- 调用模型对用户输入的关键词进行三维深度分析,生成详细判断规则
- 读取用户指定的单个图片路径或者目录下所有图片
- 逐个读取本地图片,调用模型按照判断标准识别
- 保留符合要求的图片,删除不符合要求的图片
- 输出筛选结果统计和保存路径
依赖要求
- conding-plan-models.json配置文件存在于工作区根目录
- 多模态模型API可正常访问
- 待处理图片为jpg/jpeg/png/webp格式
脚本调用
使用scripts/image_filter_pipeline.py执行识图流程,支持传入参数:
# 示例1:筛选单个图片是否符合关键词"猫"
python3 scripts/image_filter_pipeline.py --keyword "猫" --input "/path/to/cat.jpg"
# 示例2:批量筛选目录下所有图片是否符合"无人机巡检电网",使用doubao-seed-2.0-pro模型
python3 scripts/image_filter_pipeline.py --keyword "无人机巡检电网" --input "/path/to/images/" --model "doubao-seed-2.0-pro"
参数说明:
--keyword:必填,筛选关键词/判断规则描述--input:必填,待处理的单个图片路径或者目录路径--model:可选,使用的模型,默认doubao-seed-2.0-pro--delete_invalid:可选,是否自动删除不符合要求的图片,默认True,传入False则只识别不删除
Scan to join WeChat group