README
🚀 macOS 屏幕视图与控制 MCP 服务器
本项目是一个模型上下文协议(Model Context Protocol)服务器,它提供窗口截图功能。借助该服务器,大型语言模型(LLMs)能够捕获 macOS 上特定窗口的屏幕截图,可通过窗口标题或窗口 ID 精准定位。
🚀 快速开始
本服务器提供了一系列实用工具,可对 macOS 上的窗口进行操作,以下是各工具的详细介绍:
已提供的工具
capture_window_screenshot:用于捕捉指定窗口的截图,可通过窗口标题或 ID 识别。window_identifier(字符串,必需):要查找的窗口标题或窗口 ID。search_in_owner(布尔值,可选):是否在窗口所有者名称中搜索(默认:true)。format(字符串,可选):输出格式(二进制或 base64)(默认:"binary")。
list_windows:列出所有可见窗口,无需参数。find_window:根据标题或所有者名称查找窗口。title(字符串,必需):要查找的窗口标题或所有者名称。search_in_owner(布尔值,可选):是否在窗口所有者名称中搜索(默认:true)。
send_key:向活动窗口发送键盘按键事件。key(字符串,必需):要按下的键(例如:"a"、"return"、"space")。modifiers(字符串列表,可选):按住的修饰键列表(例如:["command", "shift"])。
type_text:输入一串文本字符。text(字符串,必需):要输入的文本。delay(浮点数,可选):按键之间的延迟时间(以秒为单位,默认:0.1)。
支持的键
以下是本服务器支持的各类按键:
- 字母:a - z(不区分大小写)。
- 数字:0 - 9。
- 特殊键:return、tab、space、delete、escape。
- 方向键:up_arrow、down_arrow、left_arrow、right_arrow。
- 修饰键:command、shift、control、option(还包括 right_shift、right_option、right_control)。
💻 使用示例
基础用法
发送单个按键
await send_key("return")
带有修饰符的按键
await send_key("c", ["command"]) # Command+C (复制)
输入文本
await type_text("Hello, World!")
📦 安装指南
使用 pip
您可以通过 pip 安装 macos_screen_mcp,具体命令如下:
pip install git+ssh://git@github.com/jhead/macos-screen-mcp.git
安装完成后,可使用以下命令将其作为脚本运行:
python -m macos_screen_mcp
📚 详细文档
配置
设置配置
您需要在 Claude 或 Cursor 设置中添加如下配置:
"mcpServers": {
"macos-screen": {
"name": "macos-screen",
"url": "http://localhost:8000/sse",
"description": "MCP 服务器用于捕获窗口截图",
"version": "1.0.0"
}
}
调试
您可以使用 MCP 检查器来调试服务器,命令如下:
npx @modelcontextprotocol/inspector python -m macos_screen_mcp
贡献
我们热烈欢迎任何形式的贡献,以帮助扩展和改进 macos - screen - mcp。无论您是想添加新功能、增强现有功能,还是改进文档,您的意见都非常宝贵。欢迎提交拉取请求!请随意提出新想法、错误修复或改进建议,让 macos - screen - mcp 变得更强大、更实用。
📄 许可证
macos - screen - mcp 采用 MIT License 许可证。这意味着您可以自由使用、修改和分发该软件,但需遵守 MIT License 的条款和条件。如需详细信息,请参阅项目存储库中的 LICENSE 文件。
Scan to join WeChat group