Back to MCP directory
publicPublicdnsLocal runtime

macOS Screenshot

一个提供屏幕截图和OCR文本识别功能的MCP服务器

article

README

🚀 MCP 截图

MCP 截图是一个强大的 MCP 服务器,它能够捕获截图,并对截图内容执行 OCR 文本识别,为处理图像文字信息提供了极大的便利。

点击此处

✨ 主要特性

  • 📸 截图捕捉:支持捕获屏幕的左半部分、右半部分以及全屏截图。
  • 📖 OCR 文字识别:可对日语和英语进行准确的文字识别。
  • 📄 多种输出格式:提供 JSON、Markdown、垂直、水平等多种输出格式,满足不同场景需求。

📚 详细文档

OCR 引擎

此服务器使用两种 OCR 引擎:

  1. yomitoku
    • 主要 OCR 引擎,具备高精度的日语文本识别能力。
    • 以 API 服务器的形式运行。
  2. Tesseract.js
    • 回退 OCR 引擎,当 yomitoku 不可用时发挥作用。
    • 支持日语和英语识别。

工具规范

capture

捕获截图并执行 OCR。 选项:

  • region:截图区域(可选值为 'left'、'right'、'full',默认值为 'left')。
  • format:输出格式(可选值为 'json'、'markdown'、'vertical'、'horizontal',默认值为 'markdown')。

📦 安装指南

在终端中运行以下命令进行安装:

npx -y @kazuph/mcp-screenshot

Claude Desktop 配置

将以下配置添加到你的 claude_desktop_config.json 文件中:

{
  "mcpServers": {
    "screenshot": {
      "command": "npx",
      "args": ["-y", "@kazuph/mcp-screenshot"],
      "env": {
        "OCR_API_URL": "http://localhost:8000"  // yomitoku API 基础 URL
      }
    }
  }
}

环境变量

| 属性 | 详情 | |------|------| | OCR_API_URL | yomitoku API 基础 URL,默认值为 http://localhost:8000 |

💻 使用示例

基础用法

你可以通过指示 Claude 如下使用它:

请捕获屏幕的左半部分并识别其中的文字。

📄 许可证

本项目采用 MIT 许可证。

👨‍💻 作者

kazuph

help

Runtime guide

cloud

Hosted runtime

Hosted servers run from a provider-managed environment. You usually connect the MCP client to the hosted endpoint or follow the provider's authorization flow, without keeping a local process alive

  1. Open provider connection page
  2. Authorize or copy endpoint
  3. Connect from your MCP client
terminal

Local runtime / other methods

Local servers run on your own machine or infrastructure. You normally copy the server_config into your MCP client, install the required package, and provide env variables from env_schema when needed

  1. Copy server_config
  2. Install required package
  3. Fill env variables and restart client