金大哥 - daizo-mcp MCP 详情

article

README

🚀 daizo-mcp

daizo-mcp 是一个 MCP（模型上下文协议）服务器，它能让 AI 助手直接访问包含 CBETA、巴利三藏（Pāli Tipitaka）和 SAT 在内的佛教文本数据库。该服务器采用 Rust 构建，具备高性能的文本搜索和检索能力。

🚀 快速开始

daizo-mcp 服务器允许你通过 AI 助手对佛教文本数据库进行实时搜索和检索。以下是一些你可以让 AI 助手执行的操作示例：

按标题搜索：“在 CBETA 中查找《法华经》”
按内容搜索：“在所有 CBETA 文本中搜索提及‘阿弥陀’的文本”
检索特定文本：“展示巴利圣典中《长部》第 1 经的第 1 章”
按主题探索：“《中部》对禅修有何论述？”
模式搜索：“在三藏文本中查找所有出现‘涅槃’或‘内观’的地方”
搜索并聚焦：“查找‘转法轮经’出现的位置，然后展示其前 10 行和后 200 行”

AI 能够实时搜索数千部佛教文本，并提供准确的引用。

另见：日文 README | 繁体中文 README

✨ 主要特性

快速搜索：可在整个文本语料库中进行并行正则表达式搜索，并跟踪行号。
智能检索：具备上下文感知的文本提取功能，支持提取提示和灵活的基于行的上下文。
搜索并聚焦：先查找内容，然后检索可自定义的上下文（例如，前 10 行，后 200 行）。
多种格式支持：支持 TEI P5 XML、纯文本和结构化数据。
自动数据管理：自动下载和更新文本仓库。
缓存机制：对在线查询进行智能缓存。

📦 安装指南

前提条件

下载佛教文本仓库需要 Git。安装 Git：https://git-scm.com/book/en/v2/Getting-Started-Installing-Git

快速安装

curl -fsSL https://raw.githubusercontent.com/sinryo/daizo-mcp/main/scripts/bootstrap.sh | bash -s -- --yes --write-path

此命令将自动完成以下操作：

构建二进制文件
下载 CBETA 和三藏文本仓库（约 2 - 3GB）
构建搜索索引
若可用，将其注册到 Claude Code 和 Codex

手动设置

构建：cargo build --release
安装：scripts/install.sh --prefix "$HOME/.daizo" --write-path

添加到 MCP 客户端

Claude Code CLI

claude mcp add daizo /path/to/DAIZO_DIR/bin/daizo-mcp

Codex CLI

添加到 ~/.codex/config.toml：

[mcp_servers.daizo]
command = "/path/to/DAIZO_DIR/bin/daizo-mcp"

💻 使用示例

搜索命令

# 按标题搜索
daizo-cli cbeta-title-search --query "楞伽經" --json
daizo-cli tipitaka-title-search --query "dn 1" --json

# 快速内容搜索（带行号）
daizo-cli cbeta-search --query "阿弥陀" --max-results 10
daizo-cli tipitaka-search --query "nibbana|vipassana" --max-results 15

获取命令

# 检索特定文本
daizo-cli cbeta-fetch --id T0858 --part 1 --max-chars 4000 --json
daizo-cli tipitaka-fetch --id e0101n.mul --max-chars 2000 --json

# 基于行的上下文检索（搜索后）
daizo-cli cbeta-fetch --id T0858 --line-number 342 --context-before 10 --context-after 200
daizo-cli tipitaka-fetch --id s0305m.mul --line-number 158 --context-before 5 --context-after 100

管理命令

daizo-cli doctor --verbose      # 检查安装情况
daizo-cli index-rebuild --source all  # 重建索引
daizo-cli version              # 显示版本

📚 详细文档

MCP 工具

MCP 服务器为 AI 助手提供了以下工具：

搜索工具

cbeta_title_search：在 CBETA 语料库中按标题搜索
cbeta_search：在 CBETA 文本中进行快速正则表达式内容搜索（返回行号）
tipitaka_title_search：在三藏语料库中按标题搜索
tipitaka_search：在三藏文本中进行快速正则表达式内容搜索（返回行号）
sat_search：额外的在线数据库搜索

获取工具

cbeta_fetch：按 ID 检索 CBETA 文本，并支持指定特定部分/章节
- 基于行的检索：支持 lineNumber、contextBefore、contextAfter 参数
tipitaka_fetch：按 ID 检索三藏文本，并支持章节检索
- 基于行的检索：支持 lineNumber、contextBefore、contextAfter 参数
sat_fetch、sat_pipeline：额外的数据库检索工具

搜索并聚焦工作流程

使用 *_search 查找内容并获取行号
使用 *_fetch 和 lineNumber 获取匹配内容周围的聚焦上下文

实用工具

index_rebuild：重建搜索索引（必要时自动下载数据）

数据源

CBETA（中文佛教文本）：https://github.com/cbeta-org/xml-p5
巴利三藏（罗马字转写）：https://github.com/VipassanaTech/tipitaka-xml
SAT（在线数据库）：提供额外的搜索功能

环境变量

DAIZO_DIR：基础目录（默认：~/.daizo）
- 数据：xml-p5/、tipitaka-xml/romn/
- 缓存：cache/
- 二进制文件：bin/

📄 许可证

贡献

欢迎提交问题和拉取请求。请在提交 bug 报告时包含 daizo-cli doctor --verbose 的输出。

daizo-mcp