返回 Skill 列表
extension
分类: 其它无需 API Key

智能读书助手

深度文档阅读助手,支持EPUB/PDF/DOCX格式;逐章逐节精读,先引用原文再分析;支持双链接、知识图谱、遗忘曲线;配合agent-sleep和memory-sync构建知识体系

person作者: user_b3d06a4ahubcommunity

深度文档阅读助手

任务目标

  • 本 Skill 用于:深度精读电子书和文档,建立个人知识体系
  • 能力包含:文档解析、原文引用、深度分析、双链接关联、知识图谱构建、遗忘曲线管理
  • 触发条件:用户上传电子书/文档并请求深度精读

核心原则

⚠️ 严格阅读规范

禁止行为

  • 禁止一次读完给出概括总结
  • 禁止跳过原文直接给出概括总结
  • 禁止用自有知识库代替实际阅读

必须执行

  • 严格按照文档内容,逐章逐节阅读原文
  • 先引用原文,再进行分析和解读
  • 每章产出完整的内容结构笔记
  • 识别书籍和文档的思想关联
  • 构建个人知识图谱

单次阅读控制

  • 按章节进行阅读,一次只读一个章节
  • 不建议一次读完整本书
  • 确保深度理解和消化

前置准备

  • 依赖说明:scripts脚本所需的依赖包及版本

    ebooklib==0.18
    pypdf==3.17.0
    beautifulsoup4==4.12.0
    python-docx==1.1.0
    
  • 推荐配合 Skill(用于知识管理):

    agent-sleep(睡眠归档系统)
    memory-sync-enhanced(遗忘曲线 + 共现图)
    

输出格式说明

核心要求:所有读书笔记和分析报告均以 Markdown (.md) 格式 输出

Markdown 格式优势

  • 轻量快速:纯文本格式,生成速度快,体积小
  • 易于编辑:任何文本编辑器都能打开和修改
  • 跨平台兼容:Windows/Mac/Linux 全平台支持
  • 版本管理友好:可直接用 Git 管理,便于追踪修改
  • 格式灵活:支持表格、代码块、链接、双链接等丰富格式

文件命名规范

reading/[书名]/chapter-XX.md

示例:
reading/原子习惯/chapter-01.md
reading/深度工作/chapter-02.md
reading/原则/chapter-05.md

操作步骤

1. 文档解析

调用脚本:执行 scripts/document_parser.py 解析文档文件

python /workspace/projects/ebook-reader/scripts/document_parser.py \
  --input <文档文件路径> \
  --output <输出JSON路径> \
  --section <章节编号>

参数说明

  • --input:文档文件路径(支持 .epub、.pdf、.docx 格式)
  • --output:输出 JSON 文件路径(可选,默认输出到标准输出)
  • --section:指定章节编号(推荐一次只解析一个章节)

输出格式

{
  "document_title": "书名",
  "author": "作者",
  "format": "epub",
  "total_sections": 10,
  "sections": [
    {
      "number": 1,
      "title": "章节标题",
      "content": "章节内容文本"
    }
  ]
}

2. 逐章精读(严格流程)

步骤2.1:阅读原文

智能体处理:完整阅读章节原文内容

阅读要求

  • 逐字逐句阅读,理解每一句话的含义
  • 标记重要的观点、案例、数据
  • 识别作者的核心论点和论证逻辑
  • 注意章节之间的逻辑联系

禁止操作

  • ❌ 跳过某些段落直接总结
  • ❌ 用自己的理解代替原文表述
  • ❌ 依赖外部知识库补充内容

步骤2.2:原文引用

智能体处理:准确引用原文关键内容

引用格式

> 【原文引用】
> 
> 原文内容...
> 
> —— 《书名》第X章第Y节

引用原则

  • 引用必须准确,不得改写或意译
  • 标注准确的位置信息(章节、页码)
  • 引用要完整,保留上下文
  • 不得断章取义

步骤2.3:逐节分析

智能体处理:对每个小节进行深度分析

分析要求

  • 每个小节都要独立分析
  • 先理解小节的核心观点
  • 再分析小节的论证逻辑
  • 最后提炼小节的价值和启示

输出格式

### 2.1 [小节标题]

#### 原文引用
> [原文内容]

#### 核心观点
- 观点1:...
- 观点2:...

#### 论证逻辑
- 论据1 → 结论
- 论据2 → 结论

#### 价值启示
- 对读者的启示:...
- 可应用的场景:...

3. 章节总结(逐章执行)

智能体处理:严格按照章节顺序生成总结

总结框架(参考 references/reading-framework.md):

  • 核心观点(基于原文总结,1-3句话)
  • 关键论据(基于原文提取,3-5个)
  • 逻辑结构(基于原文分析)
  • 思想关联(识别与其他书籍或文档的关联)

重要提示

  • 每个章节都必须独立完成总结
  • 总结必须基于原文,不得跳过原文
  • 不得一次读完多章再总结

4. 关键内容摘录(逐章执行)

智能体处理:从章节中识别并摘录有价值的内容

摘录标准

  • ✅ 启发性观点(颠覆认知或提供新视角)
  • ✅ 可执行方法论(具体可操作的步骤或框架)
  • ✅ 经典案例与数据(有说服力的实例)
  • ✅ 金句与隐喻(值得记忆的表达)

输出格式

## 关键内容摘录

### 摘录1:启发性观点
> [原文内容]
> 
> —— 《书名》第X章第Y节

【价值分析】
- 为什么值得摘录:...
- 对理解主题的帮助:...

### 摘录2:可执行方法论
> [原文内容]
> 
> —— 《书名》第X章第Y节

【应用分析】
- 如何应用:...
- 适用场景:...

5. 章节深度分析(逐章执行)

智能体处理:多维度分析章节内容

分析维度(详见 references/reading-framework.md):

  • 内容层面:主题深度、观点创新性、论据充分性
  • 逻辑层面:论证方式、思维模型、逻辑严密性
  • 价值层面:理论贡献、实践意义、适用边界

分析要求

  • 必须结合当前章节的具体内容进行分析
  • 避免泛泛而谈,要有具体的例子支撑
  • 分析要言之有物,指出具体的优缺点

6. 落地应用建议(逐章执行)

智能体处理:将章节内容转化为具体可执行的行动方案

应用方向框架

  • 个人层面:认知升级、习惯养成、技能提升
  • 工作层面:方法应用、决策优化、流程改进
  • 社会层面:价值传播、体系构建、影响力扩大

输出要求

## 落地应用建议

### 应用场景1:[场景描述]
【关联内容】第X章中的[具体观点或方法]

【行动建议】
1. [具体步骤1]
2. [具体步骤2]
3. [具体步骤3]

【预期效果】[可量化的预期成果]
【注意事项】[可能的问题及解决方案]

7. 双链接关联(逐章执行)

智能体处理:识别并标注书籍和文档的思想关联

双链接格式

## 思想关联

### 与《[其他书名]》的关联
- [[深度工作]]:在第2章提到的"深度工作"概念与本章的"专注力"有相似之处
- [[原子习惯]]:本章提到的"习惯养成方法"与《原子习惯》第3章的"两分钟法则"呼应
- [[原则]]:作者的"系统思维"与《原则》中的"系统化决策"有共鸣

### 思想脉络
本章的核心思想是[XXX],这与[其他作者]在《[书名]》中提出的[YYY]思想有直接关联,都强调了[共同点]。

识别维度

  • 概念关联:相同或相似的概念
  • 方法关联:相似的方法论或框架
  • 观点关联:相似或相反的观点
  • 案例关联:相似的案例或数据

8. 知识图谱节点(逐章执行)

智能体处理:将章节内容抽象为知识图谱节点

节点格式

## 知识图谱

### 核心概念节点
- **[概念名]**:[概念定义]
  - 属性:[属性1]、[属性2]
  - 关联:[[其他概念]]
  - 来源:本书第X章

### 关系节点
- **[关系名]**:[关系描述]
  - 起点:[[概念A]]
  - 终点:[[概念B]]
  - 关联:[[其他关系]]

### 实例节点
- **[实例名]**:[实例描述]
  - 类型:[类型]
  - 关联:[[相关概念]]
  - 来源:本书第X章

9. 遗忘曲线标记(逐章执行)

智能体处理:标记需要复习的关键内容

遗忘曲线格式

## 遗忘曲线标记

### 高频复习点
- **[要点1]**:[描述] [!记忆]
  - 首次复习:阅读后1天
  - 第二次复习:阅读后3天
  - 第三次复习:阅读后7天
  - 第四次复习:阅读后15天
  - 第五次复习:阅读后30天

### 中频复习点
- **[要点2]**:[描述] [!记忆]
  - 复习间隔:3天、7天、15天

### 低频复习点
- **[要点3]**:[描述] [!记忆]
  - 复习间隔:7天、30天

10. 章节笔记输出(逐章执行)

智能体处理:将所有分析内容整合为完整的章节笔记

输出要求

  • 文件格式:.md (Markdown)
  • 文件命名:reading/[书名]/chapter-XX.md
  • 编码格式:UTF-8
  • 包含完整:原文引用、分析、应用、关联、图谱、遗忘曲线

输出模板

# 《[书名]》Chapter XX: [章节标题]

## 基本信息
- **书名**:《[书名]》
- **作者**:[作者]
- **章节**:第X章:[章节标题]
- **阅读时间**:[时间]
- **阅读状态**:已完成

---

## 原文引用
> [完整引用章节原文]

---

## 章节总结
[基于原文的总结]

---

## 关键内容摘录
[摘录内容]

---

## 章节深度分析
[多维度分析]

---

## 落地应用建议
[应用建议]

---

## 思想关联(双链接)
[关联内容]

---

## 知识图谱
[图谱节点]

---

## 遗忘曲线标记
[复习标记]

11. 全书综合分析(读完所有章节后执行)

智能体处理:在完成所有章节分析后,对全书进行综合分析

分析框架(详见 references/reading-framework.md):

横向分析:正确的一面

  • 核心价值:本书最重要的贡献是什么
  • 创新观点:提出了哪些新概念、新框架、新方法
  • 实践验证:书中观点在实践中取得了哪些成果
  • 理论贡献:对相关领域的理论发展有何推动

纵向分析:不足的地方

  • 论证局限:哪些论证不够充分或有逻辑漏洞
  • 观点片面:哪些观点存在偏颇或绝对化
  • 适用边界模糊:哪些方法的应用边界不清晰
  • 时代局限:哪些观点已经过时或不适用于当前环境

时代印记分析

  • 作者背景:作者的职业、经历如何影响其观点
  • 时代背景:成书时代的社会环境、技术水平、思想潮流
  • 历史条件:当时的知识储备、研究方法、数据来源
  • 跨时代价值:哪些观点具有超越时代的普适性

12. 延伸阅读推荐

智能体处理:基于全书内容,推荐相关的延伸阅读书籍

推荐框架(详见 references/reading-framework.md):

理论深化类

  • 与本书理论相关的经典著作
  • 对本书理论进行深化或扩展的书籍
  • 不同理论流派的代表性作品

实践应用类

  • 应用本书方法的实践案例集
  • 相关领域的实操指南
  • 行业应用的成功案例

批判反思类

  • 对本书观点提出质疑或批判的著作
  • 不同立场的代表性作品
  • 相关领域的最新研究成果

配合使用 Skill

推荐配置

🛌 agent-sleep(睡眠归档系统)

功能:每日凌晨自动提炼高价值洞察到长期记忆

安装:在 ClawHub 搜索 "agent-sleep"

使用方式

  1. 阅读完章节后,将高价值洞察标记为 [!insight]
  2. agent-sleep 每日凌晨自动提取这些洞察
  3. 洞察会进入三层记忆管道(STM → LTM)

配合流程

精读笔记 → reading/[书名]/chapter-XX.md(永久保存)
    │
    ▼
每日洞察 → memory/YYYY-MM-DD.md(STM,3天半衰期)
    │
    ▼ (agent-sleep 睡眠提炼)
    │
高价值公理 → MEMORY.md(LTM,30天半衰期)

🧠 memory-sync-enhanced(遗忘曲线 + 共现图)

功能:基于遗忘曲线的记忆管理 + Hebbian 共现网络

安装:在 ClawHub 搜索 "memory-sync"

使用方式

  1. 阅读时标记需要复习的内容 [!memory]
  2. memory-sync 自动跟踪遗忘曲线
  3. 共现图自动构建概念关联网络

配合效果

  • 自动提醒复习时间
  • 可视化知识网络
  • 发现隐藏的知识关联

完整知识管理体系

阅读层(本 Skill)
  ↓
  ├─ 深度精读
  ├─ 原文引用
  ├─ 双链接关联
  └─ 知识图谱
  ↓
记忆层(agent-sleep + memory-sync)
  ↓
  ├─ STM(短期记忆):3天半衰期
  ├─ LTM(长期记忆):30天半衰期
  └─ 共现网络:Hebbian 关联
  ↓
应用层(其他 Skill)
  ↓
  ├─ 知识检索
  ├─ 创意生成
  └─ 决策支持

资源索引

注意事项

  • 首次使用需安装依赖:pip install ebooklib==0.18 pypdf==3.17.0 beautifulsoup4==4.12.0 python-docx==1.1.0
  • EPUB/DOCX格式解析效果最佳,PDF可能存在格式损失
  • 对于扫描版PDF,建议先使用OCR工具转换为文本版
  • 严格阅读规范:禁止一次读完、禁止跳过原文、禁止用知识库代替实际阅读
  • 单次阅读控制:按章节进行,一次只读一个章节
  • 原文引用要求:引用必须准确,标注位置,保留上下文
  • 双链接关联:识别书籍和文档的思想关联,构建知识网络
  • 知识图谱:将内容抽象为节点和关系,便于理解和检索
  • 遗忘曲线:标记需要复习的内容,配合 memory-sync 使用
  • 推荐配合使用:agent-sleep 和 memory-sync-enhanced 构建完整知识管理体系

使用示例

示例1:逐章深度精读

用户:请深度精读《原子习惯》第1章
执行:
1. 调用脚本解析第1章
2. 逐字逐句阅读原文
3. 准确引用关键段落
4. 对每个小节进行分析
5. 生成完整章节笔记(含双链接、知识图谱、遗忘曲线)
6. 输出到 reading/原子习惯/chapter-01.md

示例2:双链接关联分析

用户:分析《深度工作》第3章,并找出与其他书籍的思想关联
执行:
1. 解析第3章内容
2. 逐节阅读和分析
3. 识别与《原子习惯》《原则》等书籍的关联
4. 使用双链接格式标注关联
5. 构建知识图谱节点

示例3:配合记忆系统

用户:阅读《原则》第5章,并标记需要复习的内容
执行:
1. 深度精读第5章
2. 标记关键洞察 `[!insight]`
3. 标记需要复习的内容 `[!memory]`
4. 生成完整笔记
5. agent-sleep 自动提取洞察到长期记忆
6. memory-sync 跟踪遗忘曲线