深度文档阅读助手
任务目标
- 本 Skill 用于:深度精读电子书和文档,建立个人知识体系
- 能力包含:文档解析、原文引用、深度分析、双链接关联、知识图谱构建、遗忘曲线管理
- 触发条件:用户上传电子书/文档并请求深度精读
核心原则
⚠️ 严格阅读规范
禁止行为:
- ❌ 禁止一次读完给出概括总结
- ❌ 禁止跳过原文直接给出概括总结
- ❌ 禁止用自有知识库代替实际阅读
必须执行:
- ✅ 严格按照文档内容,逐章逐节阅读原文
- ✅ 先引用原文,再进行分析和解读
- ✅ 每章产出完整的内容结构笔记
- ✅ 识别书籍和文档的思想关联
- ✅ 构建个人知识图谱
单次阅读控制:
- 按章节进行阅读,一次只读一个章节
- 不建议一次读完整本书
- 确保深度理解和消化
前置准备
-
依赖说明:scripts脚本所需的依赖包及版本
ebooklib==0.18 pypdf==3.17.0 beautifulsoup4==4.12.0 python-docx==1.1.0 -
推荐配合 Skill(用于知识管理):
agent-sleep(睡眠归档系统) memory-sync-enhanced(遗忘曲线 + 共现图)
输出格式说明
核心要求:所有读书笔记和分析报告均以 Markdown (.md) 格式 输出
Markdown 格式优势:
- ✅ 轻量快速:纯文本格式,生成速度快,体积小
- ✅ 易于编辑:任何文本编辑器都能打开和修改
- ✅ 跨平台兼容:Windows/Mac/Linux 全平台支持
- ✅ 版本管理友好:可直接用 Git 管理,便于追踪修改
- ✅ 格式灵活:支持表格、代码块、链接、双链接等丰富格式
文件命名规范:
reading/[书名]/chapter-XX.md
示例:
reading/原子习惯/chapter-01.md
reading/深度工作/chapter-02.md
reading/原则/chapter-05.md
操作步骤
1. 文档解析
调用脚本:执行 scripts/document_parser.py 解析文档文件
python /workspace/projects/ebook-reader/scripts/document_parser.py \
--input <文档文件路径> \
--output <输出JSON路径> \
--section <章节编号>
参数说明:
--input:文档文件路径(支持 .epub、.pdf、.docx 格式)--output:输出 JSON 文件路径(可选,默认输出到标准输出)--section:指定章节编号(推荐一次只解析一个章节)
输出格式:
{
"document_title": "书名",
"author": "作者",
"format": "epub",
"total_sections": 10,
"sections": [
{
"number": 1,
"title": "章节标题",
"content": "章节内容文本"
}
]
}
2. 逐章精读(严格流程)
步骤2.1:阅读原文
智能体处理:完整阅读章节原文内容
阅读要求:
- 逐字逐句阅读,理解每一句话的含义
- 标记重要的观点、案例、数据
- 识别作者的核心论点和论证逻辑
- 注意章节之间的逻辑联系
禁止操作:
- ❌ 跳过某些段落直接总结
- ❌ 用自己的理解代替原文表述
- ❌ 依赖外部知识库补充内容
步骤2.2:原文引用
智能体处理:准确引用原文关键内容
引用格式:
> 【原文引用】
>
> 原文内容...
>
> —— 《书名》第X章第Y节
引用原则:
- 引用必须准确,不得改写或意译
- 标注准确的位置信息(章节、页码)
- 引用要完整,保留上下文
- 不得断章取义
步骤2.3:逐节分析
智能体处理:对每个小节进行深度分析
分析要求:
- 每个小节都要独立分析
- 先理解小节的核心观点
- 再分析小节的论证逻辑
- 最后提炼小节的价值和启示
输出格式:
### 2.1 [小节标题]
#### 原文引用
> [原文内容]
#### 核心观点
- 观点1:...
- 观点2:...
#### 论证逻辑
- 论据1 → 结论
- 论据2 → 结论
#### 价值启示
- 对读者的启示:...
- 可应用的场景:...
3. 章节总结(逐章执行)
智能体处理:严格按照章节顺序生成总结
总结框架(参考 references/reading-framework.md):
- 核心观点(基于原文总结,1-3句话)
- 关键论据(基于原文提取,3-5个)
- 逻辑结构(基于原文分析)
- 思想关联(识别与其他书籍或文档的关联)
重要提示:
- 每个章节都必须独立完成总结
- 总结必须基于原文,不得跳过原文
- 不得一次读完多章再总结
4. 关键内容摘录(逐章执行)
智能体处理:从章节中识别并摘录有价值的内容
摘录标准:
- ✅ 启发性观点(颠覆认知或提供新视角)
- ✅ 可执行方法论(具体可操作的步骤或框架)
- ✅ 经典案例与数据(有说服力的实例)
- ✅ 金句与隐喻(值得记忆的表达)
输出格式:
## 关键内容摘录
### 摘录1:启发性观点
> [原文内容]
>
> —— 《书名》第X章第Y节
【价值分析】
- 为什么值得摘录:...
- 对理解主题的帮助:...
### 摘录2:可执行方法论
> [原文内容]
>
> —— 《书名》第X章第Y节
【应用分析】
- 如何应用:...
- 适用场景:...
5. 章节深度分析(逐章执行)
智能体处理:多维度分析章节内容
分析维度(详见 references/reading-framework.md):
- 内容层面:主题深度、观点创新性、论据充分性
- 逻辑层面:论证方式、思维模型、逻辑严密性
- 价值层面:理论贡献、实践意义、适用边界
分析要求:
- 必须结合当前章节的具体内容进行分析
- 避免泛泛而谈,要有具体的例子支撑
- 分析要言之有物,指出具体的优缺点
6. 落地应用建议(逐章执行)
智能体处理:将章节内容转化为具体可执行的行动方案
应用方向框架:
- 个人层面:认知升级、习惯养成、技能提升
- 工作层面:方法应用、决策优化、流程改进
- 社会层面:价值传播、体系构建、影响力扩大
输出要求:
## 落地应用建议
### 应用场景1:[场景描述]
【关联内容】第X章中的[具体观点或方法]
【行动建议】
1. [具体步骤1]
2. [具体步骤2]
3. [具体步骤3]
【预期效果】[可量化的预期成果]
【注意事项】[可能的问题及解决方案]
7. 双链接关联(逐章执行)
智能体处理:识别并标注书籍和文档的思想关联
双链接格式:
## 思想关联
### 与《[其他书名]》的关联
- [[深度工作]]:在第2章提到的"深度工作"概念与本章的"专注力"有相似之处
- [[原子习惯]]:本章提到的"习惯养成方法"与《原子习惯》第3章的"两分钟法则"呼应
- [[原则]]:作者的"系统思维"与《原则》中的"系统化决策"有共鸣
### 思想脉络
本章的核心思想是[XXX],这与[其他作者]在《[书名]》中提出的[YYY]思想有直接关联,都强调了[共同点]。
识别维度:
- 概念关联:相同或相似的概念
- 方法关联:相似的方法论或框架
- 观点关联:相似或相反的观点
- 案例关联:相似的案例或数据
8. 知识图谱节点(逐章执行)
智能体处理:将章节内容抽象为知识图谱节点
节点格式:
## 知识图谱
### 核心概念节点
- **[概念名]**:[概念定义]
- 属性:[属性1]、[属性2]
- 关联:[[其他概念]]
- 来源:本书第X章
### 关系节点
- **[关系名]**:[关系描述]
- 起点:[[概念A]]
- 终点:[[概念B]]
- 关联:[[其他关系]]
### 实例节点
- **[实例名]**:[实例描述]
- 类型:[类型]
- 关联:[[相关概念]]
- 来源:本书第X章
9. 遗忘曲线标记(逐章执行)
智能体处理:标记需要复习的关键内容
遗忘曲线格式:
## 遗忘曲线标记
### 高频复习点
- **[要点1]**:[描述] [!记忆]
- 首次复习:阅读后1天
- 第二次复习:阅读后3天
- 第三次复习:阅读后7天
- 第四次复习:阅读后15天
- 第五次复习:阅读后30天
### 中频复习点
- **[要点2]**:[描述] [!记忆]
- 复习间隔:3天、7天、15天
### 低频复习点
- **[要点3]**:[描述] [!记忆]
- 复习间隔:7天、30天
10. 章节笔记输出(逐章执行)
智能体处理:将所有分析内容整合为完整的章节笔记
输出要求:
- 文件格式:
.md(Markdown) - 文件命名:
reading/[书名]/chapter-XX.md - 编码格式:UTF-8
- 包含完整:原文引用、分析、应用、关联、图谱、遗忘曲线
输出模板:
# 《[书名]》Chapter XX: [章节标题]
## 基本信息
- **书名**:《[书名]》
- **作者**:[作者]
- **章节**:第X章:[章节标题]
- **阅读时间**:[时间]
- **阅读状态**:已完成
---
## 原文引用
> [完整引用章节原文]
---
## 章节总结
[基于原文的总结]
---
## 关键内容摘录
[摘录内容]
---
## 章节深度分析
[多维度分析]
---
## 落地应用建议
[应用建议]
---
## 思想关联(双链接)
[关联内容]
---
## 知识图谱
[图谱节点]
---
## 遗忘曲线标记
[复习标记]
11. 全书综合分析(读完所有章节后执行)
智能体处理:在完成所有章节分析后,对全书进行综合分析
分析框架(详见 references/reading-framework.md):
横向分析:正确的一面
- 核心价值:本书最重要的贡献是什么
- 创新观点:提出了哪些新概念、新框架、新方法
- 实践验证:书中观点在实践中取得了哪些成果
- 理论贡献:对相关领域的理论发展有何推动
纵向分析:不足的地方
- 论证局限:哪些论证不够充分或有逻辑漏洞
- 观点片面:哪些观点存在偏颇或绝对化
- 适用边界模糊:哪些方法的应用边界不清晰
- 时代局限:哪些观点已经过时或不适用于当前环境
时代印记分析
- 作者背景:作者的职业、经历如何影响其观点
- 时代背景:成书时代的社会环境、技术水平、思想潮流
- 历史条件:当时的知识储备、研究方法、数据来源
- 跨时代价值:哪些观点具有超越时代的普适性
12. 延伸阅读推荐
智能体处理:基于全书内容,推荐相关的延伸阅读书籍
推荐框架(详见 references/reading-framework.md):
理论深化类
- 与本书理论相关的经典著作
- 对本书理论进行深化或扩展的书籍
- 不同理论流派的代表性作品
实践应用类
- 应用本书方法的实践案例集
- 相关领域的实操指南
- 行业应用的成功案例
批判反思类
- 对本书观点提出质疑或批判的著作
- 不同立场的代表性作品
- 相关领域的最新研究成果
配合使用 Skill
推荐配置
🛌 agent-sleep(睡眠归档系统)
功能:每日凌晨自动提炼高价值洞察到长期记忆
安装:在 ClawHub 搜索 "agent-sleep"
使用方式:
- 阅读完章节后,将高价值洞察标记为
[!insight] - agent-sleep 每日凌晨自动提取这些洞察
- 洞察会进入三层记忆管道(STM → LTM)
配合流程:
精读笔记 → reading/[书名]/chapter-XX.md(永久保存)
│
▼
每日洞察 → memory/YYYY-MM-DD.md(STM,3天半衰期)
│
▼ (agent-sleep 睡眠提炼)
│
高价值公理 → MEMORY.md(LTM,30天半衰期)
🧠 memory-sync-enhanced(遗忘曲线 + 共现图)
功能:基于遗忘曲线的记忆管理 + Hebbian 共现网络
安装:在 ClawHub 搜索 "memory-sync"
使用方式:
- 阅读时标记需要复习的内容
[!memory] - memory-sync 自动跟踪遗忘曲线
- 共现图自动构建概念关联网络
配合效果:
- 自动提醒复习时间
- 可视化知识网络
- 发现隐藏的知识关联
完整知识管理体系
阅读层(本 Skill)
↓
├─ 深度精读
├─ 原文引用
├─ 双链接关联
└─ 知识图谱
↓
记忆层(agent-sleep + memory-sync)
↓
├─ STM(短期记忆):3天半衰期
├─ LTM(长期记忆):30天半衰期
└─ 共现网络:Hebbian 关联
↓
应用层(其他 Skill)
↓
├─ 知识检索
├─ 创意生成
└─ 决策支持
资源索引
- 解析脚本:见 scripts/document_parser.py(解析文档文件,输出结构化JSON)
- 阅读框架:见 references/reading-framework.md(原文引用、双链接、知识图谱、遗忘曲线的详细框架)
注意事项
- 首次使用需安装依赖:
pip install ebooklib==0.18 pypdf==3.17.0 beautifulsoup4==4.12.0 python-docx==1.1.0 - EPUB/DOCX格式解析效果最佳,PDF可能存在格式损失
- 对于扫描版PDF,建议先使用OCR工具转换为文本版
- 严格阅读规范:禁止一次读完、禁止跳过原文、禁止用知识库代替实际阅读
- 单次阅读控制:按章节进行,一次只读一个章节
- 原文引用要求:引用必须准确,标注位置,保留上下文
- 双链接关联:识别书籍和文档的思想关联,构建知识网络
- 知识图谱:将内容抽象为节点和关系,便于理解和检索
- 遗忘曲线:标记需要复习的内容,配合 memory-sync 使用
- 推荐配合使用:agent-sleep 和 memory-sync-enhanced 构建完整知识管理体系
使用示例
示例1:逐章深度精读
用户:请深度精读《原子习惯》第1章
执行:
1. 调用脚本解析第1章
2. 逐字逐句阅读原文
3. 准确引用关键段落
4. 对每个小节进行分析
5. 生成完整章节笔记(含双链接、知识图谱、遗忘曲线)
6. 输出到 reading/原子习惯/chapter-01.md
示例2:双链接关联分析
用户:分析《深度工作》第3章,并找出与其他书籍的思想关联
执行:
1. 解析第3章内容
2. 逐节阅读和分析
3. 识别与《原子习惯》《原则》等书籍的关联
4. 使用双链接格式标注关联
5. 构建知识图谱节点
示例3:配合记忆系统
用户:阅读《原则》第5章,并标记需要复习的内容
执行:
1. 深度精读第5章
2. 标记关键洞察 `[!insight]`
3. 标记需要复习的内容 `[!memory]`
4. 生成完整笔记
5. agent-sleep 自动提取洞察到长期记忆
6. memory-sync 跟踪遗忘曲线
扫码联系在线客服