专利检索与分析助手 (Patent Assistant)
这是一个路由型的引导技能。专利 FTO(自由实施/防侵权)的检索与分析是一个多步骤的复杂过程。 作为 Agent,在执行相关的专利任务时,你需要将任务拆解为以下八个步骤。
核心原则:项目隔离与持久化
每当开始一个新的专利 FTO 项目时,你必须:
- 在
workspace目录下创建一个与项目相关的独立文件夹(例如workspace/Project_Name/)。 - 在该文件夹中持久化存储每个步骤产生的中间结果。
- 产生的所有文件必须以步骤编号打头(例如
01_完善技术方案.md,02_扩展特征.json,03_基础检索式.txt等),确保工作流可追溯、可随时中断和恢复。
核心工作流与路由机制
在开始执行任何一个具体步骤之前,你必须使用工具去阅读对应的详细指导文档,然后严格按照文档中的要求执行任务。
本技能的执行逻辑与子工具被放置在 scripts/ 目录中,相关的参考文档位于 references/ 目录中。如果特定工具需要模板或配置文件,它们会被存放在对应的 assets/ 子目录中。
步骤 1:完善技术方案与提取特征
- 目标:理解技术方案并提取检索要素,生成结构化 JSON 存入项目文件夹。
- 阅读文档:01_完善技术方案与提取特征.md
步骤 2:扩展关键词
- 目标:读取步骤 1 的 JSON,为提取的要素发散同义词及分类号,覆盖写回新 JSON。
- 阅读文档:02_扩展关键词.md
步骤 3:基础检索式构建
- 目标:调用自动化脚本读取步骤 2 的 JSON,生成跨平台的初始基础布尔检索式,存为文本文件。
- 阅读文档:03_基础检索式构建.md
步骤 4:抽样与查准率评估
- 目标:跑检索并抽样 30 篇,打分计算查准率,提取低相关度噪音样本供优化使用。
- 阅读文档:04_抽样与查准率评估.md
步骤 5:优化检索式并检索
- 目标:基于步骤 4 的查准率与噪音样本,反复迭代调整检索式,追求高查准率和较大结果数量(放弃查全率),选出 Top-1。
- 阅读文档:05_优化检索式并检索.md (注:具体的数据库检索语法指南会在该主文档中进行“渐进式披露”,由 Agent 按需读取)。
步骤 6:专利初筛
- 目标:根据最终检索结果的标题和摘要,排除明显不相关的专利,记录高风险目标。
- 阅读文档:06_专利初筛.md
步骤 7:比对技术特征
- 目标:将目标方案与高风险专利的独立权利要求进行特征比对,评估侵权风险。
- 阅读文档:07_比对技术特征.md
步骤 8:生成最终报告
- 目标:调用 Word 渲染脚本,将前期比对或检索的结构化结果转换为可交付的 Word 报告。
- 阅读文档:08_生成最终报告.md
Agent 执行规范
- LLM API 配置:
- 支持通过
--llm_provider参数指定 LLM 提供商(minimax或deepseek) - 若未配置 API Key,脚本将主动停止并提示用户
- 支持通过
- 按需路由与断点续传 (Bring Your Own Data):
- 如果用户要求从头开始,请创建新文件夹并从步骤 1 开始执行。
- 如果用户提供了已有的 Excel/CSV/JSON 数据(例如直接跳到步骤 06 或 07):请将其放入独立文件夹并顺接执行。
- Agentic 数据清洗策略:由于用户传入的外部 Excel 格式千变万化,禁止盲目依赖固定的导入工具。在处理用户自带数据时,你应该先使用 Python 脚本(如
pandas)读取文件前几行探查其结构与列名,然后根据实际情况编写适配代码或在运行时动态映射列名,将数据清洗为后续脚本支持的格式,体现 Agent 的灵活性与智能。
- 强制阅读:进入每一个步骤前,务必先调用文件读取工具查看对应的
./references/*.md文档。不要仅凭记忆或常识执行。 - 调用工具:你需要查阅对应文档获取需要使用的
python3 scripts/...命令。如果你对某个工具的参数不确定,可以先执行python3 scripts/<对应的脚本.py> --help获取详细说明。 - 逐步确认与落地:在完成一个步骤后,必须将结果写入到项目文件夹中的带编号文件内,然后建议先展示给用户看,确认无误或根据用户的反馈修改后,再进入下一个环节。
Scan to contact