返回 MCP 目录
public公开dns本地运行

unstructured-document-processor-mcp

一个提供非结构化文档处理能力的MCP服务器,支持多种文件格式,帮助LLM提取和使用文档内容。

article

README

🚀 无结构化文档处理功能的模型上下文协议(Model Context Protocol)服务器

本服务器提供无结构化文档处理功能,能让大型语言模型(LLMs)从无结构化文档中提取并使用内容。

⚠️ 重要提示

此仓库正在开发中,请谨慎使用 :)

🚀 快速开始

支持的文件类型

本服务器支持以下多种文件类型:

{".abw", ".bmp", ".csv", ".cwk", ".dbf", ".dif", ".doc", ".docm", ".docx", ".dot",
 ".dotm", ".eml", ".epub", ".et", ".eth", ".fods", ".gif", ".heic", ".htm", ".html",
 ".hwp", ".jpeg", ".jpg", ".md", ".mcw", ".mw", ".odt", ".org", ".p7s", ".pages",
 ".pbd", ".pdf", ".png", ".pot", ".potm", ".ppt", ".pptm", ".pptx", ".prn", ".rst",
 ".rtf", ".sdp", ".sgl", ".svg", ".sxg", ".tiff", ".txt", ".tsv", ".uof", ".uos1",
 ".uos2", ".web", ".webp", ".wk2", ".xls", ".xlsb", ".xlsm", ".xlsx", ".xlw", ".xml",
 ".zabw"}

先决条件

你需要准备以下内容:

将此MCP添加到Claude Desktop的步骤

  1. 克隆仓库并设置UV环境。
  2. 在根目录下创建一个.env文件,并在其中添加以下环境变量:UNSTRUCTURED_API_KEY
  3. 运行MCP服务器:uv run doc_processor.py
  4. 转到~/Library/Application Support/Claude/并创建一个claude_desktop_config.json文件。在该文件中添加以下内容:
{
    "mcpServers": {
        "unstructured_doc_processor": {
            "command": "YOUR UV PATH",
            "args": [
                "--directory",
                "ABSOLUTE PATH TO YOUR unstructured-mcp/",
                "run",
                "doc_processor.py"
            ],
            "disabled": false
        }
    }
}
  1. 重启Claude Desktop。你现在应该可以使用此MCP了。
help

运行方式说明

cloud

托管运行

托管运行通常表示这个 MCP Server 由服务方环境承载,用户一般按页面提供的连接方式或授权流程接入,不需要在本地长期启动一个 MCP 进程

  1. 打开服务方连接页
  2. 完成授权或复制端点
  3. 在 MCP 客户端中连接
terminal

本地运行 / 其它方式

本地运行通常需要用户在自己的电脑或服务器上安装依赖,把 server_config 复制到 MCP 客户端,并按 env_schema 补齐环境变量、密钥或其它配置

  1. 复制 server_config
  2. 安装所需依赖
  3. 补齐环境变量后重启客户端