article
README
🚀 Runbook AI MCP Server
Runbook AI MCP Server 是一个 MCP(模型上下文协议)服务器,它通过 Chrome 扩展程序提供浏览器自动化功能。它允许像 Claude Code 这样基于终端的代理通过你的实时浏览器会话与任何网站进行交互。
它是 Runbook AI 生态系统的一部分。加入 Discord 社区 提供反馈并参与开发!
🚀 快速开始
要开始使用 Runbook AI MCP Server,你需要完成 MCP 服务器和 Chrome 扩展程序的安装,并进行相应的设置。
✨ 主要特性
大多数基于浏览器的 MCP 工具(如 chrome-devtools-mcp)会在每次浏览器操作后发送整个 DOM,从而占用大量的大语言模型上下文窗口。而 Runbook AI 与众不同:
- 优化上下文:它生成高度简化的 HTML 版本,去除无用信息,同时保留关键文本和交互元素。这种简化的 HTML 紧凑、快速,不会消耗过多的令牌。
- 通用解决方案:如果某个网站没有专门的 MCP 服务器(如 Expedia、LinkedIn 或内部工具),Runbook AI 可以完美填补这一空白。
- 隐私至上:它完全在你的浏览器中运行,除了与你选择的大语言模型提供商进行远程调用外,不进行其他远程调用。并且不使用
eval()或可疑脚本(由 Chrome 扩展程序沙箱强制执行)。 - 高效导航:简化后的 HTML 超越了视口范围,使滚动和多页面任务更加高效。
📦 安装指南
MCP 服务器
将以下内容添加到你的 MCP 设置配置中:
{
"mcpServers": {
"runbook-ai": {
"command": "npx",
"args": ["-y", "runbook-ai-mcp@latest"]
}
}
}
Chrome 扩展程序
- 从 Chrome 网上应用店安装 Runbook AI 扩展程序。
- 从扩展程序侧边栏打开扩展程序设置,启用 MCP。
- 设置大语言模型 API 密钥、模型名称和基础 URL。建议使用 Gemini 3 Flash(gemini-3-flash-preview)。你可以从 Google AI Studio 获取免费的 API 密钥。
- 默认情况下,扩展程序可以访问 所有 网站。如果你想限制访问范围,可以转到 Chrome 扩展程序详细信息,在“站点访问”设置中添加单个站点。
💻 使用示例
基础用法
- 打开 Chrome 浏览器,并保持扩展程序侧边栏打开。
- 启动 MCP 服务器(当 MCP 客户端调用时,它将自动启动)。
工具调用示例
服务器公开了一个工具:browser-agent,用于在 Chrome 浏览器中运行具有人工智能和自动化功能的任务。
参数:
prompt(字符串,必需):供人工智能代理执行的任务提示
示例:
{
"name": "browser-agent",
"arguments": {
"prompt": "Go to google.com and search for 'MCP protocol'"
}
}
🔧 技术细节
开发命令
# 安装依赖
npm install
# 构建项目
npm run build
# 以开发模式运行
npm run dev
# 运行测试
npm test
架构说明
- MCP 服务器:通过标准输入输出与 MCP 客户端进行通信。
- WebSocket 服务器:在端口 9003 监听 Chrome 扩展程序的连接。
- Chrome 扩展程序:执行浏览器自动化任务。
当调用工具时:
- MCP 客户端通过标准输入输出向 MCP 服务器发送请求。
- MCP 服务器通过 WebSocket 将请求转发给 Chrome 扩展程序。
- 扩展程序执行任务并返回结果。
- 结果被发送回 MCP 客户端。
🤝 贡献
欢迎贡献代码!请随时提交拉取请求。
微信扫一扫