返回 MCP 目录
public公开dns本地运行

textin-mcp

TextIn MCP Server是一个文档文本提取和OCR工具,支持从图片、PDF和Word中识别文本、提取关键信息并转换为Markdown格式。

article

README

🚀 TextIn MCP 服务器

TextIn MCP 服务器是一款强大的工具,可从文档中提取文本并进行 OCR 处理。它支持文档文字识别、身份证件识别和发票识别等功能,还能将文档转换为 Markdown 格式,为文档处理提供了极大的便利。

🚀 快速开始

TextIn MCP 服务器提供了多种实用工具,可满足不同的文档处理需求。

✨ 主要特性

工具介绍

  • recognition_text
    • 功能:可从图像、Word 文档和 PDF 文件中进行文字识别。
    • 输入:支持 文件路径指向文档的 HTTP/HTTPS URL(字符串)。
    • 输出:文档中的文本。
    • 支持转换格式:PDF、图像(Jpeg, Jpg, Png, Bmp)。
  • doc_to_markdown
    • 功能:将图像、PDF 和 Word 文档转换为 Markdown 格式。
    • 输入:支持 文件路径指向文档的 HTTP/HTTPS URL(字符串)。
    • 输出:文档的 Markdown 格式。
    • 支持转换格式:PDF、Microsoft Office 文档(Word, Excel)、图像(Jpeg, Jpg, Png, Bmp)。
  • general_information_extraction
    • 功能:智能自动提取文档中的关键信息。
    • 输入:支持 文件路径指向文档的 HTTP/HTTPS URL(字符串)。
    • 输出:关键信息 JSON。
    • 支持转换格式:PDF、Microsoft Office 文档(Word, Excel)、图像(Jpeg, Jpg, Png, Bmp)。

⚠️ 重要提示

当输入为 URL 时,不支持访问受保护资源。

📦 安装指南

APP_ID 和 APP_SECRET

您需要点击 这里 注册 TextIn 账户,并根据 此处 的说明获取 Textin 的 APP_IDAPP_SECRET

NPX

使用以下配置进行安装:

{
  "mcpServers": {
    "textin-ocr": {
      "command": "npx",
      "args": [
        "-y",
        "@intsig/server-textin"
      ],
      "env": {
        "APP_ID": "<YOUR_APP_ID>",
        "APP_SECRET": "<YOUR_APP_SECRET>",
        "MCP_SERVER_REQUEST_TIMEOUT": "600000"
      },
      "timeout": 600
    }
  }
}

📄 许可证

此 MCP 服务器根据 MIT 许可证发布。这意味着您可以自由使用、修改和分发软件,但需遵守 MIT 许可证的条款和条件。有关详细信息,请参阅项目存储库中的 LICENSE 文件。

help

运行方式说明

cloud

托管运行

托管运行通常表示这个 MCP Server 由服务方环境承载,用户一般按页面提供的连接方式或授权流程接入,不需要在本地长期启动一个 MCP 进程

  1. 打开服务方连接页
  2. 完成授权或复制端点
  3. 在 MCP 客户端中连接
terminal

本地运行 / 其它方式

本地运行通常需要用户在自己的电脑或服务器上安装依赖,把 server_config 复制到 MCP 客户端,并按 env_schema 补齐环境变量、密钥或其它配置

  1. 复制 server_config
  2. 安装所需依赖
  3. 补齐环境变量后重启客户端