返回 MCP 目录
public公开dns本地运行

macos-screen-mcp

一个用于macOS的屏幕视图与控制MCP服务,提供窗口截图、窗口查找和键盘输入功能,支持通过窗口标题或ID进行操作。

article

README

🚀 macOS 屏幕视图与控制 MCP 服务器

本项目是一个模型上下文协议(Model Context Protocol)服务器,它提供窗口截图功能。借助该服务器,大型语言模型(LLMs)能够捕获 macOS 上特定窗口的屏幕截图,可通过窗口标题或窗口 ID 精准定位。

🚀 快速开始

本服务器提供了一系列实用工具,可对 macOS 上的窗口进行操作,以下是各工具的详细介绍:

已提供的工具

  • capture_window_screenshot:用于捕捉指定窗口的截图,可通过窗口标题或 ID 识别。
    • window_identifier(字符串,必需):要查找的窗口标题或窗口 ID。
    • search_in_owner(布尔值,可选):是否在窗口所有者名称中搜索(默认:true)。
    • format(字符串,可选):输出格式(二进制或 base64)(默认:"binary")。
  • list_windows:列出所有可见窗口,无需参数。
  • find_window:根据标题或所有者名称查找窗口。
    • title(字符串,必需):要查找的窗口标题或所有者名称。
    • search_in_owner(布尔值,可选):是否在窗口所有者名称中搜索(默认:true)。
  • send_key:向活动窗口发送键盘按键事件。
    • key(字符串,必需):要按下的键(例如:"a"、"return"、"space")。
    • modifiers(字符串列表,可选):按住的修饰键列表(例如:["command", "shift"])。
  • type_text:输入一串文本字符。
    • text(字符串,必需):要输入的文本。
    • delay(浮点数,可选):按键之间的延迟时间(以秒为单位,默认:0.1)。

支持的键

以下是本服务器支持的各类按键:

  • 字母:a - z(不区分大小写)。
  • 数字:0 - 9。
  • 特殊键:return、tab、space、delete、escape。
  • 方向键:up_arrow、down_arrow、left_arrow、right_arrow。
  • 修饰键:command、shift、control、option(还包括 right_shift、right_option、right_control)。

💻 使用示例

基础用法

发送单个按键

await send_key("return")

带有修饰符的按键

await send_key("c", ["command"])  # Command+C (复制)

输入文本

await type_text("Hello, World!")

📦 安装指南

使用 pip

您可以通过 pip 安装 macos_screen_mcp,具体命令如下:

pip install git+ssh://git@github.com/jhead/macos-screen-mcp.git

安装完成后,可使用以下命令将其作为脚本运行:

python -m macos_screen_mcp

📚 详细文档

配置

设置配置

您需要在 Claude 或 Cursor 设置中添加如下配置:

"mcpServers": {
 "macos-screen": {
    "name": "macos-screen",
    "url": "http://localhost:8000/sse",
    "description": "MCP 服务器用于捕获窗口截图",
    "version": "1.0.0"
  }
}

调试

您可以使用 MCP 检查器来调试服务器,命令如下:

npx @modelcontextprotocol/inspector python -m macos_screen_mcp

贡献

我们热烈欢迎任何形式的贡献,以帮助扩展和改进 macos - screen - mcp。无论您是想添加新功能、增强现有功能,还是改进文档,您的意见都非常宝贵。欢迎提交拉取请求!请随意提出新想法、错误修复或改进建议,让 macos - screen - mcp 变得更强大、更实用。

📄 许可证

macos - screen - mcp 采用 MIT License 许可证。这意味着您可以自由使用、修改和分发该软件,但需遵守 MIT License 的条款和条件。如需详细信息,请参阅项目存储库中的 LICENSE 文件。

help

运行方式说明

cloud

托管运行

托管运行通常表示这个 MCP Server 由服务方环境承载,用户一般按页面提供的连接方式或授权流程接入,不需要在本地长期启动一个 MCP 进程

  1. 打开服务方连接页
  2. 完成授权或复制端点
  3. 在 MCP 客户端中连接
terminal

本地运行 / 其它方式

本地运行通常需要用户在自己的电脑或服务器上安装依赖,把 server_config 复制到 MCP 客户端,并按 env_schema 补齐环境变量、密钥或其它配置

  1. 复制 server_config
  2. 安装所需依赖
  3. 补齐环境变量后重启客户端