返回 MCP 目录
public公开dns本地运行

mcp-windows-desktop-automation

一个基于MCP协议的Windows桌面自动化服务,通过AutoIt实现各种桌面操作功能。

article

README

🚀 Windows 桌面自动化 MCP 服务器

本项目是一个借助 AutoIt 实现的 Windows 桌面自动化 Model Context Protocol (MCP) 服务器,能让 LLM 应用程序通过 MCP 协议自动化处理 Windows 桌面任务,功能强大且实用。

🚀 快速开始

本项目提供了一个 TypeScript MCP 服务器,它封装了 node-autoit-koffi 包,允许 LLM 应用程序通过 MCP 协议自动化 Windows 桌面任务。

✨ 主要特性

  • 完整封装所有 AutoIt 函数作为 MCP 工具,功能全面。
  • 支持 stdio 和 WebSocket 传输协议,使用灵活。
  • 具备文件访问资源,可用于读取文件和目录。
  • 拥有截图资源,能捕获屏幕或特定窗口。
  • 提供常见自动化任务的提示模板,方便快捷。
  • 严格使用 TypeScript 类型,保证代码质量。

📦 安装指南

# 克隆仓库
git clone https://github.com/yourusername/mcp-windows-desktop-automation.git
cd mcp-windows-desktop-automation

# 安装依赖
npm install

# 构建项目
npm run build

💻 使用示例

启动服务器

# 通过 stdio 传输启动(默认)
npm start

# 通过 WebSocket 传输启动
npm start -- --transport=websocket --port=3000

# 启用详细日志记录
npm start -- --verbose

命令行选项

  • --transport=stdio|websocket:指定传输协议(默认:stdio)
  • --port=<number>:指定 WebSocket 传输的端口(默认:3000)
  • --verbose:启用详细日志记录

📚 详细文档

工具

服务器提供以下工具用于:

  • 鼠标操作:移动、点击、拖动等。
  • 键盘操作:发送键击,剪贴板操作等。
  • 窗口管理:查找、激活、关闭、调整窗口大小等。
  • 控件操作:与 UI 控件交互,按钮、文本框等。
  • 进程管理:启动、停止和监控进程。
  • 系统操作:关机、睡眠等。

资源

服务器提供以下资源用于:

  • 文件访问:读取文件和列出目录。
  • 截图:捕获屏幕或特定窗口。

提示

服务器提供以下提示模板用于:

  • 窗口交互:查找并交互窗口。
  • 表单填写:自动化表单填写任务。
  • 自动化任务:创建重复性任务脚本。
  • 监控:等待特定条件。

开发

# 以开发模式运行
npm run dev

# 检查代码风格
npm run lint

# 运行测试
npm run test

📄 许可证

本项目采用 MIT 许可证。

help

运行方式说明

cloud

托管运行

托管运行通常表示这个 MCP Server 由服务方环境承载,用户一般按页面提供的连接方式或授权流程接入,不需要在本地长期启动一个 MCP 进程

  1. 打开服务方连接页
  2. 完成授权或复制端点
  3. 在 MCP 客户端中连接
terminal

本地运行 / 其它方式

本地运行通常需要用户在自己的电脑或服务器上安装依赖,把 server_config 复制到 MCP 客户端,并按 env_schema 补齐环境变量、密钥或其它配置

  1. 复制 server_config
  2. 安装所需依赖
  3. 补齐环境变量后重启客户端