article
README
🚀 Windows 桌面自动化 MCP 服务器
本项目是一个借助 AutoIt 实现的 Windows 桌面自动化 Model Context Protocol (MCP) 服务器,能让 LLM 应用程序通过 MCP 协议自动化处理 Windows 桌面任务,功能强大且实用。
🚀 快速开始
本项目提供了一个 TypeScript MCP 服务器,它封装了 node-autoit-koffi 包,允许 LLM 应用程序通过 MCP 协议自动化 Windows 桌面任务。
✨ 主要特性
- 完整封装所有 AutoIt 函数作为 MCP 工具,功能全面。
- 支持 stdio 和 WebSocket 传输协议,使用灵活。
- 具备文件访问资源,可用于读取文件和目录。
- 拥有截图资源,能捕获屏幕或特定窗口。
- 提供常见自动化任务的提示模板,方便快捷。
- 严格使用 TypeScript 类型,保证代码质量。
📦 安装指南
# 克隆仓库
git clone https://github.com/yourusername/mcp-windows-desktop-automation.git
cd mcp-windows-desktop-automation
# 安装依赖
npm install
# 构建项目
npm run build
💻 使用示例
启动服务器
# 通过 stdio 传输启动(默认)
npm start
# 通过 WebSocket 传输启动
npm start -- --transport=websocket --port=3000
# 启用详细日志记录
npm start -- --verbose
命令行选项
--transport=stdio|websocket:指定传输协议(默认:stdio)--port=<number>:指定 WebSocket 传输的端口(默认:3000)--verbose:启用详细日志记录
📚 详细文档
工具
服务器提供以下工具用于:
- 鼠标操作:移动、点击、拖动等。
- 键盘操作:发送键击,剪贴板操作等。
- 窗口管理:查找、激活、关闭、调整窗口大小等。
- 控件操作:与 UI 控件交互,按钮、文本框等。
- 进程管理:启动、停止和监控进程。
- 系统操作:关机、睡眠等。
资源
服务器提供以下资源用于:
- 文件访问:读取文件和列出目录。
- 截图:捕获屏幕或特定窗口。
提示
服务器提供以下提示模板用于:
- 窗口交互:查找并交互窗口。
- 表单填写:自动化表单填写任务。
- 自动化任务:创建重复性任务脚本。
- 监控:等待特定条件。
开发
# 以开发模式运行
npm run dev
# 检查代码风格
npm run lint
# 运行测试
npm run test
📄 许可证
本项目采用 MIT 许可证。
Scan to contact