article
README
🚀 daizo-mcp
daizo-mcp 是一个 MCP(模型上下文协议)服务器,它能让 AI 助手直接访问包含 CBETA、巴利三藏(Pāli Tipitaka)和 SAT 在内的佛教文本数据库。该服务器采用 Rust 构建,具备高性能的文本搜索和检索能力。
🚀 快速开始
daizo-mcp 服务器允许你通过 AI 助手对佛教文本数据库进行实时搜索和检索。以下是一些你可以让 AI 助手执行的操作示例:
- 按标题搜索:“在 CBETA 中查找《法华经》”
- 按内容搜索:“在所有 CBETA 文本中搜索提及‘阿弥陀’的文本”
- 检索特定文本:“展示巴利圣典中《长部》第 1 经的第 1 章”
- 按主题探索:“《中部》对禅修有何论述?”
- 模式搜索:“在三藏文本中查找所有出现‘涅槃’或‘内观’的地方”
- 搜索并聚焦:“查找‘转法轮经’出现的位置,然后展示其前 10 行和后 200 行”
AI 能够实时搜索数千部佛教文本,并提供准确的引用。
另见:日文 README | 繁体中文 README
✨ 主要特性
- 快速搜索:可在整个文本语料库中进行并行正则表达式搜索,并跟踪行号。
- 智能检索:具备上下文感知的文本提取功能,支持提取提示和灵活的基于行的上下文。
- 搜索并聚焦:先查找内容,然后检索可自定义的上下文(例如,前 10 行,后 200 行)。
- 多种格式支持:支持 TEI P5 XML、纯文本和结构化数据。
- 自动数据管理:自动下载和更新文本仓库。
- 缓存机制:对在线查询进行智能缓存。
📦 安装指南
前提条件
下载佛教文本仓库需要 Git。 安装 Git:https://git-scm.com/book/en/v2/Getting-Started-Installing-Git
快速安装
curl -fsSL https://raw.githubusercontent.com/sinryo/daizo-mcp/main/scripts/bootstrap.sh | bash -s -- --yes --write-path
此命令将自动完成以下操作:
- 构建二进制文件
- 下载 CBETA 和三藏文本仓库(约 2 - 3GB)
- 构建搜索索引
- 若可用,将其注册到 Claude Code 和 Codex
手动设置
- 构建:
cargo build --release - 安装:
scripts/install.sh --prefix "$HOME/.daizo" --write-path
添加到 MCP 客户端
Claude Code CLI
claude mcp add daizo /path/to/DAIZO_DIR/bin/daizo-mcp
Codex CLI
添加到 ~/.codex/config.toml:
[mcp_servers.daizo]
command = "/path/to/DAIZO_DIR/bin/daizo-mcp"
💻 使用示例
搜索命令
# 按标题搜索
daizo-cli cbeta-title-search --query "楞伽經" --json
daizo-cli tipitaka-title-search --query "dn 1" --json
# 快速内容搜索(带行号)
daizo-cli cbeta-search --query "阿弥陀" --max-results 10
daizo-cli tipitaka-search --query "nibbana|vipassana" --max-results 15
获取命令
# 检索特定文本
daizo-cli cbeta-fetch --id T0858 --part 1 --max-chars 4000 --json
daizo-cli tipitaka-fetch --id e0101n.mul --max-chars 2000 --json
# 基于行的上下文检索(搜索后)
daizo-cli cbeta-fetch --id T0858 --line-number 342 --context-before 10 --context-after 200
daizo-cli tipitaka-fetch --id s0305m.mul --line-number 158 --context-before 5 --context-after 100
管理命令
daizo-cli doctor --verbose # 检查安装情况
daizo-cli index-rebuild --source all # 重建索引
daizo-cli version # 显示版本
📚 详细文档
MCP 工具
MCP 服务器为 AI 助手提供了以下工具:
搜索工具
- cbeta_title_search:在 CBETA 语料库中按标题搜索
- cbeta_search:在 CBETA 文本中进行快速正则表达式内容搜索(返回行号)
- tipitaka_title_search:在三藏语料库中按标题搜索
- tipitaka_search:在三藏文本中进行快速正则表达式内容搜索(返回行号)
- sat_search:额外的在线数据库搜索
获取工具
- cbeta_fetch:按 ID 检索 CBETA 文本,并支持指定特定部分/章节
- 基于行的检索:支持
lineNumber、contextBefore、contextAfter参数
- 基于行的检索:支持
- tipitaka_fetch:按 ID 检索三藏文本,并支持章节检索
- 基于行的检索:支持
lineNumber、contextBefore、contextAfter参数
- 基于行的检索:支持
- sat_fetch、sat_pipeline:额外的数据库检索工具
搜索并聚焦工作流程
- 使用
*_search查找内容并获取行号 - 使用
*_fetch和lineNumber获取匹配内容周围的聚焦上下文
实用工具
- index_rebuild:重建搜索索引(必要时自动下载数据)
数据源
- CBETA(中文佛教文本):https://github.com/cbeta-org/xml-p5
- 巴利三藏(罗马字转写):https://github.com/VipassanaTech/tipitaka-xml
- SAT(在线数据库):提供额外的搜索功能
环境变量
- DAIZO_DIR:基础目录(默认:~/.daizo)
- 数据:xml-p5/、tipitaka-xml/romn/
- 缓存:cache/
- 二进制文件:bin/
📄 许可证
MIT 或 Apache 2.0 许可证 © 2025 Shinryo Taniguchi
贡献
欢迎提交问题和拉取请求。请在提交 bug 报告时包含 daizo-cli doctor --verbose 的输出。
微信扫一扫