Back to MCP directory
publicPublicdnsLocal runtime

pdf-tools-mcp

基于MCP框架的PDF工具集,提供本地与远程PDF文件的合并、元数据提取、文本处理等功能。

article

README

🚀 PDF 工具 MCP

PDF 工具 MCP 是一套基于模型上下文协议(MCP)构建的全面 PDF 操作工具,能满足本地和远程的多种 PDF 操作需求,为用户提供便捷、高效的 PDF 处理体验。

🚀 快速开始

启动 MCP 服务器:

python -m src.main

该服务器通过 MCP 协议提供 PDF 操作端点。

✨ 主要特性

本地 PDF 操作

  • 显示:将 PDF 页面渲染为图像
  • 合并:将多个页面合并到一个长页面中
  • 元数据:提取文档元信息
  • 文本:提取文本块和详细的文本信息
  • 片段:从 PDF 页面创建自由形式或全宽的片段
  • 融合:将多个文档的页面合并为一个文档

远程 PDF 操作

  • 显示:将远程 PDF 页面渲染为图像
  • 下载:从 URL 获取 PDF 并存储到本地

📦 安装指南

# 克隆仓库
git clone https://github.com/yourusername/pdf-tools-mcp.git
cd pdf-tools-mcp

# 安装依赖项
uv pip install -e .

💻 使用示例

基础用法

启动 MCP 服务器:

python -m src.main

该服务器通过 MCP 协议提供 PDF 操作端点。

高级用法

# 更新依赖项
uv pip install -e . --upgrade

# 提交更改(使用约定式提交格式)
cz commit

🔧 技术细节

  • 需要 Python 3.12+ 版本。
  • 使用 MCP 框架进行工具注册。
  • PDF 文档使用 UUID4 文件名存储,确保安全性。

📚 详细文档

依赖项

  • MCP 框架
  • PyMuPDF
  • aiohttp/aiofiles 用于异步操作
  • python-magic-bin 用于文件类型检测

📄 许可证

本项目采用 MIT 许可证。查看LICENSE

help

Runtime guide

cloud

Hosted runtime

Hosted servers run from a provider-managed environment. You usually connect the MCP client to the hosted endpoint or follow the provider's authorization flow, without keeping a local process alive

  1. Open provider connection page
  2. Authorize or copy endpoint
  3. Connect from your MCP client
terminal

Local runtime / other methods

Local servers run on your own machine or infrastructure. You normally copy the server_config into your MCP client, install the required package, and provide env variables from env_schema when needed

  1. Copy server_config
  2. Install required package
  3. Fill env variables and restart client