专利检索与分析助手 (Patent Assistant)

这是一个路由型的引导技能。专利 FTO（自由实施/防侵权）的检索与分析是一个多步骤的复杂过程。作为 Agent，在执行相关的专利任务时，你需要将任务拆解为以下八个步骤。

核心原则：项目隔离与持久化

每当开始一个新的专利 FTO 项目时，你必须：

在 workspace 目录下创建一个与项目相关的独立文件夹（例如 workspace/Project_Name/）。
在该文件夹中持久化存储每个步骤产生的中间结果。
产生的所有文件必须以步骤编号打头（例如 01_完善技术方案.md, 02_扩展特征.json, 03_基础检索式.txt 等），确保工作流可追溯、可随时中断和恢复。

核心工作流与路由机制

在开始执行任何一个具体步骤之前，你必须使用工具去阅读对应的详细指导文档，然后严格按照文档中的要求执行任务。本技能的执行逻辑与子工具被放置在 scripts/ 目录中，相关的参考文档位于 references/ 目录中。如果特定工具需要模板或配置文件，它们会被存放在对应的 assets/ 子目录中。

步骤 1：完善技术方案与提取特征

目标：理解技术方案并提取检索要素，生成结构化 JSON 存入项目文件夹。
阅读文档：01_完善技术方案与提取特征.md

步骤 2：扩展关键词

目标：读取步骤 1 的 JSON，为提取的要素发散同义词及分类号，覆盖写回新 JSON。
阅读文档：02_扩展关键词.md

步骤 3：基础检索式构建

目标：调用自动化脚本读取步骤 2 的 JSON，生成跨平台的初始基础布尔检索式，存为文本文件。
阅读文档：03_基础检索式构建.md

步骤 4：抽样与查准率评估

目标：跑检索并抽样 30 篇，打分计算查准率，提取低相关度噪音样本供优化使用。
阅读文档：04_抽样与查准率评估.md

步骤 5：优化检索式并检索

目标：基于步骤 4 的查准率与噪音样本，反复迭代调整检索式，追求高查准率和较大结果数量（放弃查全率），选出 Top-1。
阅读文档：05_优化检索式并检索.md （注：具体的数据库检索语法指南会在该主文档中进行“渐进式披露”，由 Agent 按需读取）。

步骤 6：专利初筛

目标：根据最终检索结果的标题和摘要，排除明显不相关的专利，记录高风险目标。
阅读文档：06_专利初筛.md

步骤 7：比对技术特征

目标：将目标方案与高风险专利的独立权利要求进行特征比对，评估侵权风险。
阅读文档：07_比对技术特征.md

步骤 8：生成最终报告

目标：调用 Word 渲染脚本，将前期比对或检索的结构化结果转换为可交付的 Word 报告。
阅读文档：08_生成最终报告.md

Agent 执行规范

LLM API 配置：
- 支持通过 --llm_provider 参数指定 LLM 提供商（minimax 或 deepseek）
- 若未配置 API Key，脚本将主动停止并提示用户
按需路由与断点续传 (Bring Your Own Data)：
- 如果用户要求从头开始，请创建新文件夹并从步骤 1 开始执行。
- 如果用户提供了已有的 Excel/CSV/JSON 数据（例如直接跳到步骤 06 或 07）：请将其放入独立文件夹并顺接执行。
- Agentic 数据清洗策略：由于用户传入的外部 Excel 格式千变万化，禁止盲目依赖固定的导入工具。在处理用户自带数据时，你应该先使用 Python 脚本（如 pandas）读取文件前几行探查其结构与列名，然后根据实际情况编写适配代码或在运行时动态映射列名，将数据清洗为后续脚本支持的格式，体现 Agent 的灵活性与智能。
强制阅读：进入每一个步骤前，务必先调用文件读取工具查看对应的 ./references/*.md 文档。不要仅凭记忆或常识执行。
调用工具：你需要查阅对应文档获取需要使用的 python3 scripts/... 命令。如果你对某个工具的参数不确定，可以先执行 python3 scripts/<对应的脚本.py> --help 获取详细说明。
逐步确认与落地：在完成一个步骤后，必须将结果写入到项目文件夹中的带编号文件内，然后建议先展示给用户看，确认无误或根据用户的反馈修改后，再进入下一个环节。