返回 MCP 目录
public公开dns本地运行

mcp-browser-automation-server

MCP浏览器自动化服务器是一个基于REST API的浏览器控制工具,支持创建会话、页面导航、截图、元素操作和实时控制台日志监控等功能。

article

README

🚀 MCP 浏览器自动化服务器

MCP 浏览器自动化服务器是一款简单却功能强大的工具,它支持通过 REST API 对浏览器进行灵活控制,能够截取屏幕截图,还能实时监控控制台日志,为浏览器自动化操作提供了便利。

🚀 快速开始

MCP 浏览器自动化服务器可通过 REST API 控制浏览器,实现创建会话、导航页面、截图等功能。以下是启动服务器的步骤:

python server.py

服务器将在 http://localhost:8000 上运行。

✨ 主要特性

  • 创建会话
  • 导航到 URL
  • 截取屏幕截图(全页或特定元素)
  • 点击元素
  • 填充表单输入
  • 通过 WebSocket 实时监控控制台日志
  • 关闭会话

📦 安装指南

  1. 克隆此仓库:
git clone https://github.com/weir1/mcp-browser-automation.git
cd mcp-browser-automation
  1. 创建虚拟环境并激活:
python -m venv venv
.\venv\Scripts\Activate
  1. 安装依赖项:
pip install -r requirements.txt
  1. 安装 Playwright 浏览器:
playwright install

📚 详细文档

API 端点

创建新会话

POST /session/create
响应:{ "session_id": "..." }

导航到 URL

POST /session/{session_id}/navigate?url=https://example.com

截取屏幕截图

POST /session/{session_id}/screenshot?name=screenshot1&selector=.my-element

如果未提供选择器,则截取全页屏幕截图。

点击元素

POST /session/{session_id}/click?selector=.my-button

填充表单输入

POST /session/{session_id}/fill?selector=input[name="username"]&value=myuser

监控控制台日志

WebSocket /session/{session_id}/console

关闭会话

POST /session/{session_id}/close

💻 使用示例

基础用法

import requests
import websockets
import asyncio
import json

# 创建一个会话
response = requests.post("http://localhost:8000/session/create")
session_id = response.json()["session_id"]

# 导航到 URL
requests.post(f"http://localhost:8000/session/{session_id}/navigate?url=https://example.com")

# 截取屏幕截图
response = requests.post(f"http://localhost:8000/session/{session_id}/screenshot?name=example")
with open("screenshot.png", "wb") as f:
    f.write(response.content)

# 监控控制台日志
async def monitor_console():
    async with websockets.connect(f"ws://localhost:8000/session/{session_id}/console") as ws:
        while True:
            message = await ws.recv()
            print(json.loads(message))

asyncio.get_event_loop().run_until_complete(monitor_console())

📄 许可证

MIT

help

运行方式说明

cloud

托管运行

托管运行通常表示这个 MCP Server 由服务方环境承载,用户一般按页面提供的连接方式或授权流程接入,不需要在本地长期启动一个 MCP 进程

  1. 打开服务方连接页
  2. 完成授权或复制端点
  3. 在 MCP 客户端中连接
terminal

本地运行 / 其它方式

本地运行通常需要用户在自己的电脑或服务器上安装依赖,把 server_config 复制到 MCP 客户端,并按 env_schema 补齐环境变量、密钥或其它配置

  1. 复制 server_config
  2. 安装所需依赖
  3. 补齐环境变量后重启客户端