返回 MCP 目录
public公开dns本地运行

mcp-pdf-extraction-server

PDF内容提取服务

article

README

🚀 PDF内容提取MCP服务器

本服务器提供了一个实用工具,可高效地从PDF文件中提取内容,满足用户对PDF文本信息获取的需求。

🚀 快速开始

✨ 主要特性

  • 提供 extract-pdf-contents 工具,用于提取本地PDF文件的内容。
  • 支持指定文件路径与提取页面范围,页面编号支持负数索引。
  • 融合 PDF 阅读器和 OCR 功能,增强内容提取能力。

📦 安装指南

在Claude Desktop上的配置

  • MacOS:配置文件路径为 ~/Library/Application\ Support/Claude/claude_desktop_config.json
  • Windows:配置文件路径为 %APPDATA%/Claude/claude_desktop_config.json
开发/未发布的服务器配置 ``` "mcpServers": { "pdf_extraction": { "command": "uv", "args": [ "--directory", "/Users/xraywu/Workspace/pdf_extraction", "run", "pdf_extraction" ] } } ```
已发布的服务器配置 ``` "mcpServers": { "pdf_extraction": { "command": "uvx", "args": [ "pdf_extraction" ] } } ```

📚 详细文档

工具说明

  • extract-pdf-contents:该工具用于提取本地PDF文件的内容。
    • 参数详情
      • pdf_path(必填):字符串类型,指定要提取内容的本地PDF文件路径。
      • pages(可选):字符串类型,指定从PDF文件中提取内容的页面编号,页面编号用逗号分隔,支持负数索引(例如 -1 表示最后一页)。
    • 功能特性:支持 PDF 阅读器和 OCR 功能。
help

运行方式说明

cloud

托管运行

托管运行通常表示这个 MCP Server 由服务方环境承载,用户一般按页面提供的连接方式或授权流程接入,不需要在本地长期启动一个 MCP 进程

  1. 打开服务方连接页
  2. 完成授权或复制端点
  3. 在 MCP 客户端中连接
terminal

本地运行 / 其它方式

本地运行通常需要用户在自己的电脑或服务器上安装依赖,把 server_config 复制到 MCP 客户端,并按 env_schema 补齐环境变量、密钥或其它配置

  1. 复制 server_config
  2. 安装所需依赖
  3. 补齐环境变量后重启客户端