可执行专业能力构建器
核心理念
Artisan 不是生成文档,是萃取可执行技能。
一个好的专业能力构建器产出的是一套可立即执行的技能卡片库:
- 他能用什么原子化技能解决问题?(一个卡片一个方法)
- 他何时使用这个技能?(明确的Trigger触发条件)
- 他如何执行这个技能?(1-2-3具体步骤)
- 他什么情况不应该使用?(清晰的Boundary边界)
- 他如何验证掌握程度?(自测问题验证)
关键区分:萃取的是可执行的专业技能,不是知识的堆砌框架。
三维验证式技能萃取法:
- V1 跨域验证:至少2个独立来源佐证
- V2 预测力验证:能解决实际工作问题
- V3 独特性验证:不是常识,有独特洞见
职业身份 vs 人物身份
| 维度 | 人物 Skill(女娲) | 职业专家 Skill(Artisan) | |------|------------------|------------------------| | 蒸馏对象 | 具体个人的思维框架 | 职业身份的专业视角 | | 知识来源 | 个人著作、访谈、演讲 | 专业文献、法规、案例、标准 | | 思维框架 | 个人独创的心智模型 | 职业共识方法论 + 行业实践 | | 表达风格 | 模仿个人的语言特征 | 遵循职业表达规范 | | 可验证性 | 对比个人公开表态 | 对比行业标准和专业共识 | | 时效性 | 需跟踪个人最新动态 | 更新专业法规和行业实践 |
任务目标
- 本 Skill 用于:系统化构建专业专家能力,蒸馏为可执行技能卡片库
- 能力包含:
- 专家身份定义(T型知识结构)
- 多维度并行提取(6个维度)
- 三重验证筛选(V1跨域/V2预测力/V3独特性)
- 知行合一技能卡片构造(R/I/A1/A2/E/B六段结构)
- 知识链接与索引
- 自测与验证
- 触发条件:用户请求创建职业专家能力库、构建领域专业视角或生成标准化可执行技能
前置准备
- 依赖说明:scripts依赖pypdf、python-docx、PyYAML、markdown
- 用户准备:
- 明确职业身份(如"刑法律师"、"产品经理")
- 可选:上传私有知识文件(PDF/Word/Markdown)
- 可选:提供应用场景偏好(如"合同审查"、"需求分析")
操作步骤
阶段0: 专家身份定义(T型知识结构)
- 主领域定义:核心领域、核心概念、理论框架、行业标准
- 辅助领域定义:辅助领域、权重分配、融合点
- 知识融合策略:融合方法、冲突处理、跨领域框架
- 输出:EXPERT_OVERVIEW.md
- 【用户确认节点1】确认专家身份定义
阶段1: 多维度并行提取
并行提取6个维度:
- 维度1: 学科基础(核心概念、理论框架、基本原理)
- 维度2: 法规规范(法律法规、行业标准、政策文件)
- 维度3: 方法论(分析框架、决策流程、思维模型)
- 维度4: 典型案例(成功案例、失败案例、行业数据)
- 维度5: 行业实践(实务技巧、行业惯例、最佳实践)
- 维度6: 表达规范(专业术语、文书格式、沟通风格)
用户私有知识处理:
- 调用
python scripts/parse_document.py --file_path <路径>解析文件 - 将内容归入对应维度
提取标准:
- 必须标注来源(文献、法规、案例等)
- 必须用自己的话重写(避免照搬)
- 必须保留原文引用(≤150字/段)
输出:candidates/*.md
阶段1.5: 三重验证筛选(核心)
对每个提取的内容单元执行三重验证:
V1 跨域验证:
- ✅ 通过:2个及以上独立来源提及或佐证
- ⚠️ 待确认:只有1个来源提及
- ❌ 不通过:无明确出处或仅提及一次
V2 预测力验证:
- ✅ 通过:能解决至少1个实际工作问题
- ⚠️ 待确认:只能解释理论,无法解决实际问题
- ❌ 不通过:无法迁移到实际场景
V3 独特性验证:
- ✅ 通过:有独特洞见或反常识观点
- ⚠️ 待确认:有一定深度但不够独特
- ❌ 不通过:纯属常识或陈词滥调
验证结果处理:
- 3个✅ → 进入阶段2,标记为"核心技能"
- 2个✅ + 1个⚠️ → 进入阶段2,标记为"辅助技能"
- 其他组合 → 写入rejected/,附原因
输出:skills/pending/ + rejected/
【用户确认节点2】确认重点方向
阶段2: 知行合一技能卡片构造
对通过验证的内容,构造独立技能卡片:
六段结构:
- R (Reading) 核心原理:原文引用(≤150字)+ 来源
- I (Interpretation) 方法论解读:用自己的话重写
- A1 (Past Application) 行业案例:实际应用案例
- A2 (Future Trigger) 触发条件:何时使用(至少2个情境)
- E (Execution) 执行步骤:1-2-3具体可执行步骤
- B (Boundary) 边界条件:不适用场景(至少2个)
输出:skills/skill-XXX.md
【用户确认节点3】确认可执行性
阶段3: 知识链接与索引
建立技能卡片之间的链接关系:
- 依赖关系:A技能需要先掌握B技能
- 对比关系:A技能与B技能适用场景不同
- 组合关系:A技能 + B技能产生协同
- 递进关系:A技能是B技能的高级版
输出:INDEX.md
阶段4: 自测与验证
为每个技能卡片设计自测问题:
- 应该使用此方法的场景(2题)
- 不应该使用此方法的场景(2题)
- 边界场景(1题)
输出:tests/*.md
输出结构
expert-skills/
├── EXPERT_OVERVIEW.md # 阶段0:专家概览
├── INDEX.md # 阶段3:技能索引
├── CHANGELOG.md # 版本变更记录
├── candidates/ # 阶段1:原始提取池
│ ├── discipline-foundation.md
│ ├── regulations.md
│ ├── methodologies.md
│ ├── cases.md
│ ├── industry-practices.md
│ └── expression-norms.md
├── rejected/ # 阶段1.5:未通过验证
│ ├── rejected-items.md
│ └── reasons.md
├── skills/ # 阶段2:技能卡片库
│ ├── skill-001-[名称].md
│ ├── skill-002-[名称].md
│ └── ...
└── tests/ # 阶段4:自测题库
├── self-tests.md
└── scenarios.md
质量红线
违反以下任一红线将阻止输出:
| 红线 | 标准 | 违反处理 | |------|------|----------| | 原文引用超限 | >150字/段 | 阻止输出,要求精简 | | 缺少Trigger | A2字段为空 | 阻止输出,要求补充 | | 缺少Boundary | B字段为空 | 阻止输出,要求补充 | | 执行步骤空泛 | 不是1-2-3具体步骤 | 阻止输出,要求细化 | | 未通过验证 | 三重验证<2个✅ | 降级为辅助技能或淘汰 | | 缺少自测问题 | 无自测问题 | 阻止输出,要求补充 | | 缺少原文引用 | 无出处标注 | 阻止输出,要求补充 | | 跳过用户确认 | 未获得确认继续 | 阻止输出,要求确认 |
使用示例
示例1: 创建完整专家能力库
- 场景/输入: "创建一个刑法律师的专业能力库"
- 预期产出: 生成专家概览 + 技能卡片库 + 自测题库
- 关键要点:
- 阶段0: 定义主领域(刑法)+ 辅助领域(刑诉法、证据法)
- 阶段1: 并行提取6个维度
- 阶段1.5: 三重验证筛选,保留核心技能
- 阶段2: 构造知行合一技能卡片(每个卡片都有Trigger和Boundary)
- 阶段3: 建立技能链接索引
- 阶段4: 生成自测问题
示例2: 互联网领域专家
- 场景/输入: "创建一个B端产品经理的专业能力库"
- 预期产出: 生成包含需求分析、业务架构、产品规划的技能卡片库
- 关键要点:
- 参考互联网行业专项指南
- 重点提取:需求分析方法论、PRD规范、产品规划流程
- 每个技能卡片都有明确的Trigger(何时使用)和Boundary(不适用场景)
- 提供1-2-3可执行步骤
示例3: 跨学科专家(T型知识结构)
- 场景/输入: "创建一个智慧城市解决方案专家的能力库"
- 预期产出: 生成融合城市规划、技术和人文视角的技能卡片库
- 关键要点:
- T型知识结构:城市规划(70%)+ 计算机科学(15%)+ 数据科学(10%)+ 社会学(5%)
- 识别融合点:城市数据、智能交通、社会公平
- 为跨领域技能卡片设计自测问题
示例4: 快速模式(跳过验证)
- 场景/输入: "快速生成一个数据分析师的能力库"
- 预期产出: 生成基础的技能卡片库
- 关键要点:
- 跳过阶段1(多维度提取)
- 跳过阶段1.5(三重验证)
- 直接构造技能卡片
- 适用于时间紧迫或内容简单的场景
脚本调用说明
执行三重验证
python scripts/verify_content.py \
--input_dir "/workspace/projects/expert-skills/candidates" \
--output_dir "/workspace/projects/expert-skills/skills/pending" \
--rejected_dir "/workspace/projects/expert-skills/rejected"
生成技能卡片
python scripts/generate_skill.py \
--expert_name "刑法律师" \
--expert_overview "/workspace/projects/expert-skills/EXPERT_OVERVIEW.md" \
--verified_skills "/workspace/projects/expert-skills/skills/pending" \
--output_dir "/workspace/projects/expert-skills/skills"
生成自测问题
python scripts/generate_self_tests.py \
--skills_dir "/workspace/projects/expert-skills/skills" \
--output_dir "/workspace/projects/expert-skills/tests"
质量验证
python scripts/validate_structure.py \
--skill_path "/workspace/projects/expert-skills"
用户确认节点话术
节点1: 专家身份定义确认
总裁,专家身份定义已完成!
【核心内容】
- 主领域:刑法
- 辅助领域:刑事诉讼法(权重20%)、证据法(权重15%)
- 知识融合策略:以刑法为核心,辅以程序法视角
请确认:
[ ] 定义准确,继续下一步
[ ] 需要修改(请指出)
节点2: 重点方向确认
总裁,内容提取和验证完成!
【提取结果】
- 通过验证:15个技能点
- 未通过:3个(已存档rejected/)
【重点方向】
- 核心技能:犯罪构成分析(3个✅)、量刑方法(3个✅)
- 辅助技能:证据规则审查(2个✅+1个⚠️)
请确认:
[ ] 方向正确,继续制作技能卡片
[ ] 需要调整(请说明)
节点3: 可执行性确认
总裁,技能卡片已完成!
【完成情况】
- 技能卡片:15个
- 自测问题:45道
【示例卡片】
[展示一个完整的技能卡片]
请确认:
[ ] 可执行性强,可以输出
[ ] 需要改进(请说明)
资源索引
脚本
- scripts/verify_content.py(用途:执行三重验证(V1跨域/V2预测力/V3独特性),支持自动验证和交互式验证)
- scripts/generate_self_tests.py(用途:为技能卡片生成针对性自测问题,评估掌握程度和盲点)
- scripts/generate_skill.py(用途:生成技能卡片库,包括专家概览、技能卡片和自测题库)
- scripts/parse_document.py(用途:解析用户上传的PDF/Word/Markdown文件)
- scripts/validate_structure.py(用途:验证Skill结构完整性)
- scripts/refine_skill.py(用途:生成评审模板和优化建议)
- scripts/validate_skill_quality.py(用途:验证专家Skill质量指标)
参考
- references/extraction-methodology.md(何时读取:阶段1-3执行三维验证式技能萃取时)
- references/profession-taxonomy.md(何时读取:阶段0识别职业身份层级时)
- references/cross-disciplinary-guide.md(何时读取:创建跨学科专家时)
- references/knowledge-fusion-methods.md(何时读取:阶段2知识融合时)
- references/internet-industry-guide.md(何时读取:创建互联网领域专家时)
- references/skill-template.md(何时读取:阶段2提炼框架结构时)
- references/collection-dimensions.md(何时读取:阶段1执行六维度采集时)
- references/refinement-workflow.md(何时读取:阶段4执行双Agent精炼时)
资产(模板)
- templates/skill-card-template.md(用途:生成知行合一技能卡片,包含R/I/A1/A2/E/B六段结构)
- templates/self-test-template.md(用途:生成自测问题,评估技能掌握程度)
- templates/verification-record-template.md(用途:记录三重验证过程和结果)
注意事项
- 仅在需要时读取参考文档,保持上下文简洁
- 3个用户确认节点(阶段0之后、阶段1.5、阶段2.5)必须等待用户确认后才能继续
- 质量红线必须严格遵守:原文引用≤150字、必须有Trigger和Boundary、必须有自测问题
- 用户私有知识优先级最高,应覆盖公开知识
- 充分利用智能体的网络搜索和内容理解能力,避免为简单任务编写脚本
- 三重验证通过率应≥60%,低于此标准需重新萃取
- 保留candidates/和rejected/目录,形成审计轨迹,便于追溯决策过程
Scan to join WeChat group