article
README
🚀 TextIn MCP 服务器
TextIn MCP 服务器是一款强大的工具,可从文档中提取文本并进行 OCR 处理。它支持文档文字识别、身份证件识别和发票识别等功能,还能将文档转换为 Markdown 格式,为文档处理提供了极大的便利。
🚀 快速开始
TextIn MCP 服务器提供了多种实用工具,可满足不同的文档处理需求。
✨ 主要特性
工具介绍
recognition_text- 功能:可从图像、Word 文档和 PDF 文件中进行文字识别。
- 输入:支持
文件路径或指向文档的 HTTP/HTTPS URL(字符串)。 - 输出:文档中的文本。
- 支持转换格式:PDF、图像(Jpeg, Jpg, Png, Bmp)。
doc_to_markdown- 功能:将图像、PDF 和 Word 文档转换为 Markdown 格式。
- 输入:支持
文件路径或指向文档的 HTTP/HTTPS URL(字符串)。 - 输出:文档的 Markdown 格式。
- 支持转换格式:PDF、Microsoft Office 文档(Word, Excel)、图像(Jpeg, Jpg, Png, Bmp)。
general_information_extraction- 功能:智能自动提取文档中的关键信息。
- 输入:支持
文件路径或指向文档的 HTTP/HTTPS URL(字符串)。 - 输出:关键信息 JSON。
- 支持转换格式:PDF、Microsoft Office 文档(Word, Excel)、图像(Jpeg, Jpg, Png, Bmp)。
⚠️ 重要提示
当输入为 URL 时,不支持访问受保护资源。
📦 安装指南
APP_ID 和 APP_SECRET
您需要点击 这里 注册 TextIn 账户,并根据 此处 的说明获取 Textin 的 APP_ID 和 APP_SECRET。
NPX
使用以下配置进行安装:
{
"mcpServers": {
"textin-ocr": {
"command": "npx",
"args": [
"-y",
"@intsig/server-textin"
],
"env": {
"APP_ID": "<YOUR_APP_ID>",
"APP_SECRET": "<YOUR_APP_SECRET>",
"MCP_SERVER_REQUEST_TIMEOUT": "600000"
},
"timeout": 600
}
}
}
📄 许可证
此 MCP 服务器根据 MIT 许可证发布。这意味着您可以自由使用、修改和分发软件,但需遵守 MIT 许可证的条款和条件。有关详细信息,请参阅项目存储库中的 LICENSE 文件。
扫码联系在线客服