返回 MCP 目录
public公开dns本地运行

pdf-reader-mcp-server-(@shtse8pdf-reader-mcp)

PDF阅读器MCP服务,为AI代理提供安全读取PDF文件内容(文本、元数据、页数)的能力,支持本地和远程PDF文件,易于集成到MCP环境中。

article

README

🚀 PDF 阅读器 MCP 服务器

这是一个专门为 AI 代理打造的 PDF 阅读器 MCP(Multi-Model Collaboration Protocol)服务器。借助此服务器,AI 代理能够通过 MCP 协议,安全地从 PDF 文件里提取文本、元数据以及其他相关信息。

🚀 快速开始

PDF 阅读器 MCP 服务器为 AI 代理提供了安全提取 PDF 信息的途径。你可以按照以下安装方法启动服务,然后依据示例用法进行操作。

✨ 主要特性

  • 全文提取:从 PDF 文件中提取完整的文本内容。
  • 特定页面提取:读取指定页码或页码范围的内容。
  • 元数据提取:获取 PDF 的元数据,如作者、标题、创建日期等。
  • 页数统计:返回 PDF 文件的总页数。
  • 多源处理:一次请求中可以同时处理多个 PDF 来源(本地路径或 URL)。
  • 安全性高:严格限制文件访问权限在项目根目录内,确保安全。

📦 安装指南

使用 npm 安装

  1. 全局安装
npm install -g pdf-reader-mcp
  1. 启动服务
pdf-reader-mcp start

使用 Docker 安装

  1. 拉取镜像
docker pull sylphlab/pdf-reader-mcp
  1. 运行容器
docker run -p 3000:3000 sylphlab/pdf-reader-mcp

💻 使用示例

基础用法

{
  "tool": "read_pdf",
  "args": {
    "source": "path/to/file.pdf"
  }
}

返回结果示例

{
  "status": "success",
  "result": {
    "text": "PDF 文本内容...",
    "metadata": {
      "title": "文档标题",
      "author": "作者名称",
      "creationDate": "2023-10-05"
    },
    " pageCount": 10
  }
}

🔧 技术细节

优势

  • 安全性:通过限制文件访问范围确保安全。
  • 灵活性:支持本地路径和 URL 源。
  • 高效性:提供结构化的 JSON 输出,便于后续处理。

使用场景

  • 数据抽取:从大量 PDF 文件中提取有用信息。
  • 文档分析:用于 AI 驱动的内容分析工具。
  • 教育领域:辅助学习管理系统中的文档处理。

未来计划

  1. 文档完善:增加更多使用案例和详细说明。
  2. 性能优化:进一步提升解析速度和效率。
  3. 功能扩展:考虑支持图像提取和注释解析。

🤝 支持与贡献

📄 许可证

本项目遵循 MIT License,具体内容请参考 LICENSE

help

运行方式说明

cloud

托管运行

托管运行通常表示这个 MCP Server 由服务方环境承载,用户一般按页面提供的连接方式或授权流程接入,不需要在本地长期启动一个 MCP 进程

  1. 打开服务方连接页
  2. 完成授权或复制端点
  3. 在 MCP 客户端中连接
terminal

本地运行 / 其它方式

本地运行通常需要用户在自己的电脑或服务器上安装依赖,把 server_config 复制到 MCP 客户端,并按 env_schema 补齐环境变量、密钥或其它配置

  1. 复制 server_config
  2. 安装所需依赖
  3. 补齐环境变量后重启客户端