返回 MCP 目录
public公开dns本地运行

wayland-mcp

Wayland MCP是一个为现代Linux桌面提供截图分析及输入控制工具的服务项目,解决现有方案在Wayland环境下的可靠性问题。

article

README

🚀 Wayland MCP 服务器

Wayland MCP 服务器专为现代 Linux 桌面环境打造,因现有截图方案在 Wayland 设置中不可靠而创建。它提供了截图、分析以及鼠标和键盘控制等实用工具。

状态: 进行中 许可证: GPL3

⚠️ 重要提示

该项目创建是因为现有的截图解决方案在我的 Wayland 设置中无法可靠工作。Wayland MCP 提供了截图、分析、鼠标和键盘控制工具,适用于现代 Linux 桌面环境。

✨ 主要特性

  • 📸 截图与分析

    • 定制的 VLM 集成用于图像分析
    • 图像比较功能
  • 🖱️ 输入模拟

    • 鼠标控制(移动、点击、拖动、滚动)
    • 键盘输入(打字、按键)
    • 动作链,支持复杂序列操作

⚠️ 安全警告

⚠️ 重要提示

启用输入控制会赋予 MCP 服务器完全的鼠标和键盘访问权限。仅在受信任的 MCP 服务器和模型上启用。

🚀 快速开始

🔧 输入模拟设置

./setup.sh

查看 setup.sh 在 GitHub 上

配置权限以允许 evemu-event 控制输入设备。

⚙️ MCP 服务器配置

添加到你的 MCP 服务器配置文件(.roo/mcp.json)中:

{
  "mcpServers": {
    "wayland-screenshot": {
      "command": "uvx",
      "args": ["wayland-mcp"],
      "env": {
        "OPENROUTER_API_KEY": "your-api-key",
        "VLM_MODEL": "qwen/qwen2.5-vl-72b-instruct:free",
        "XDG_RUNTIME_DIR": "/run/user/1000",
        "WAYLAND_MCP_PORT": "4999",
        "DISPLAY": ":0",
        "WAYLAND_DISPLAY": "wayland-0",
        "XDG_SESSION_TYPE": "wayland"
      }
    }
  }
}

📦 安装指南

git clone https://github.com/someaka/wayland-mcp
cd wayland-mcp
pip install -e .

📄 许可证

GPL 3

help

运行方式说明

cloud

托管运行

托管运行通常表示这个 MCP Server 由服务方环境承载,用户一般按页面提供的连接方式或授权流程接入,不需要在本地长期启动一个 MCP 进程

  1. 打开服务方连接页
  2. 完成授权或复制端点
  3. 在 MCP 客户端中连接
terminal

本地运行 / 其它方式

本地运行通常需要用户在自己的电脑或服务器上安装依赖,把 server_config 复制到 MCP 客户端,并按 env_schema 补齐环境变量、密钥或其它配置

  1. 复制 server_config
  2. 安装所需依赖
  3. 补齐环境变量后重启客户端