Back to MCP directory
publicPublicdnsLocal runtime

pdf-reader-mcp-server-(@shtse8pdf-reader-mcp)

PDF阅读器MCP服务,为AI代理提供安全读取PDF文件内容(文本、元数据、页数)的能力,支持本地和远程PDF文件,易于集成到MCP环境中。

article

README

🚀 PDF 阅读器 MCP 服务器

这是一个专门为 AI 代理打造的 PDF 阅读器 MCP(Multi-Model Collaboration Protocol)服务器。借助此服务器,AI 代理能够通过 MCP 协议,安全地从 PDF 文件里提取文本、元数据以及其他相关信息。

🚀 快速开始

PDF 阅读器 MCP 服务器为 AI 代理提供了安全提取 PDF 信息的途径。你可以按照以下安装方法启动服务,然后依据示例用法进行操作。

✨ 主要特性

  • 全文提取:从 PDF 文件中提取完整的文本内容。
  • 特定页面提取:读取指定页码或页码范围的内容。
  • 元数据提取:获取 PDF 的元数据,如作者、标题、创建日期等。
  • 页数统计:返回 PDF 文件的总页数。
  • 多源处理:一次请求中可以同时处理多个 PDF 来源(本地路径或 URL)。
  • 安全性高:严格限制文件访问权限在项目根目录内,确保安全。

📦 安装指南

使用 npm 安装

  1. 全局安装
npm install -g pdf-reader-mcp
  1. 启动服务
pdf-reader-mcp start

使用 Docker 安装

  1. 拉取镜像
docker pull sylphlab/pdf-reader-mcp
  1. 运行容器
docker run -p 3000:3000 sylphlab/pdf-reader-mcp

💻 使用示例

基础用法

{
  "tool": "read_pdf",
  "args": {
    "source": "path/to/file.pdf"
  }
}

返回结果示例

{
  "status": "success",
  "result": {
    "text": "PDF 文本内容...",
    "metadata": {
      "title": "文档标题",
      "author": "作者名称",
      "creationDate": "2023-10-05"
    },
    " pageCount": 10
  }
}

🔧 技术细节

优势

  • 安全性:通过限制文件访问范围确保安全。
  • 灵活性:支持本地路径和 URL 源。
  • 高效性:提供结构化的 JSON 输出,便于后续处理。

使用场景

  • 数据抽取:从大量 PDF 文件中提取有用信息。
  • 文档分析:用于 AI 驱动的内容分析工具。
  • 教育领域:辅助学习管理系统中的文档处理。

未来计划

  1. 文档完善:增加更多使用案例和详细说明。
  2. 性能优化:进一步提升解析速度和效率。
  3. 功能扩展:考虑支持图像提取和注释解析。

🤝 支持与贡献

📄 许可证

本项目遵循 MIT License,具体内容请参考 LICENSE

help

Runtime guide

cloud

Hosted runtime

Hosted servers run from a provider-managed environment. You usually connect the MCP client to the hosted endpoint or follow the provider's authorization flow, without keeping a local process alive

  1. Open provider connection page
  2. Authorize or copy endpoint
  3. Connect from your MCP client
terminal

Local runtime / other methods

Local servers run on your own machine or infrastructure. You normally copy the server_config into your MCP client, install the required package, and provide env variables from env_schema when needed

  1. Copy server_config
  2. Install required package
  3. Fill env variables and restart client