article
README
🚀 MCP 浏览器操作员
MCP 浏览器操作员是一款强大的服务器,主要用于浏览器自动化、借助 LLM 控制浏览器、与网页进行交互以及分析网页内容。它通过 JSON - RPC 接口实现了标准化,为用户提供了便捷、高效的操作体验。
🚀 快速开始
MCP 浏览器操作员使用起来较为简单,以下为你介绍运行服务器的方式:
# 以开发模式运行
python -m src/mcp_operator.server dev --port 3000
# 以生产模式运行
python -m src/mcp_operator.server production --port 3000
✨ 主要特性
核心功能
- 浏览器管理:可轻松创建、导航和关闭浏览器实例,为用户提供灵活的浏览器操作体验。
- 任务跟踪:能够异步执行复杂任务,例如网页互动和自动化操作,提高工作效率。
- 网页交互:借助 LLM 控制浏览器进行高级操作,满足多样化的网页交互需求。
- 工具访问:提供丰富的调试工具(如控制台日志、网络日志)和审计工具(如可访问性审计、性能审计),助力开发和优化工作。
其他功能
- 持久化状态:通过项目名称维护独立的浏览器会话,支持多个项目,方便管理不同的工作场景。
- 安全性:具备域名阻止、URL 验证和会话隔离等安全机制,保障用户的使用安全。
📦 安装指南
安装要求
- Python:版本需 3.11 及以上。
- Playwright:一款强大的浏览器自动化工具。
- OpenAI API 密钥:在使用 LLM 控制功能时是必需的。
安装步骤
# 安装 MCP 操作员
pip install mcp-browser-operator
# 安装 Playwright
playwright install chromium firefox
💻 使用示例
可执行脚本
- run - server:用于启动 MCP 服务器。
- run - tests:执行单元测试和集成测试,确保系统的稳定性。
- run - test - harness:使用 MCP 检查仪进行调试。
📚 详细文档
核心 API 方法
浏览器操作
- 创建浏览器实例:
mcp__browser - operator__createBrowser - 导航到 URL:
mcp__browser - operator__navigate - 关闭浏览器:
mcp__browser - operator__closeBrowser
异步任务管理
- 启动任务:调用浏览器方法获取
job_id。 - 检查进度:使用
get - job - status直到任务完成。 - 处理结果:从任务状态中提取结果。
用户笔记
- 添加笔记:
mcp__browser - operator__addNote
调试工具
- 获取控制台日志:
mcp__browser - tools__getConsoleLogs - 截图:
mcp__browser - tools__takeScreenshot
审计工具
- 可访问性审计:
mcp__browser - tools__runAccessibilityAudit - 性能审计:
mcp__browser - tools__runPerformanceAudit
🔧 技术细节
项目结构
src/mcp_operator/
├── __init__.py
├── __main__.py
├── server.py
├── browser.py
└── cua/
├── agent.py
├── computer.py
└── utils.py
开发指南
使用 MCP 检查仪
# 通过运行测试 harness 启动
./run - test - harness
# 或直接使用检查仪
npx @modelcontextprotocol/inspector ./run - server
安全措施
- 域名阻止:防止访问恶意网站,保障系统安全。
- URL 验证:在导航前验证 URL 的安全性,避免潜在风险。
- 会话隔离:不同浏览器实例之间完全隔离,确保数据和操作的独立性。
Scan to join WeChat group