返回 MCP 目录
public公开dns本地运行

Puppeteer Linux

一个基于Puppeteer的MCP服务器,提供浏览器自动化功能,支持Linux下的X11和Wayland显示服务器,包含页面导航、截图、点击等交互工具。

article

README

🚀 MCP-Puppeteer-Linux

MCP-Puppeteer-Linux 是一个提供浏览器自动化功能的模型上下文协议(Model Context Protocol)服务器,它借助 Puppeteer 实现相关功能,并且完全支持 Linux 显示服务器(X11 和 Wayland)。该服务器让大语言模型(LLM)能够与网页进行交互、截取屏幕截图以及执行 JavaScript 代码,一切都在真实的浏览器环境中运行。

🚀 快速开始

MCP-Puppeteer-Linux 为大语言模型提供了在真实浏览器环境中与网页交互的能力。你可以通过配置相应的工具和资源,实现网页导航、截图、点击等操作。以下是一个适用于 Claude 桌面的配置示例:

{
  "mcp": {
    "servers": [
      {
        "name": "puppeteer_navigate",
        "command": "cd /path/to/app && npm start"
      },
      {
        "name": "puppeteer_screenshot",
        "command": "cd /path/to/app && npm run screenshot"
      }
    ]
  }
}

✨ 主要特性

  • 浏览器自动化功能:支持网页导航、截图、点击、鼠标悬停、表单填写等操作。
  • 显示服务器支持:全面支持 X11 和 Wayland 显示服务器。
  • 动态环境变量配置:自动检测并配置相应的环境变量。
  • 回退机制和鲁棒错误处理:确保在各种情况下都能稳定运行。
  • XWayland 兼容性:保证在 XWayland 环境下也能正常工作。

📦 安装指南

通过 Smithery 自动安装

# 使用以下命令自动安装:
smithery install @PhialsBasement/mcp-puppeteer-linux

手动安装

  1. 克隆此仓库:
    git clone https://github.com/PhialsBasement/mcp-puppeteer_linux.git
    cd mcp-puppeteer_linux
    
  2. 安装依赖项并运行:
    npm install
    node index.js
    

📚 详细文档

显示服务器支持

此分支添加了对 Linux 显示服务器的自动检测和配置:

  • 自动检测 X11/Wayland
  • 动态环境变量配置
  • 支持各种桌面环境(GNOME、KDE 等)
  • 回退机制和鲁棒错误处理
  • XWayland 兼容性

组件

工具

  • puppeteer_navigate
    • 在浏览器中导航到任何 URL
    • 输入:url (字符串)
  • puppeteer_screenshot
    • 截取网页或特定元素的屏幕截图
    • 输入:
      • name (字符串,必填):屏幕截图名称
      • selector (字符串,可选):CSS 选择器用于截取元素
      • width (数字,可选,默认:800):截图宽度
      • height (数字,可选,默认:600):截图高度
  • puppeteer_click
    • 点击页面上的元素
    • 输入:selector (字符串):要点击的元素的 CSS 选择器
  • puppeteer_hover
    • 鼠标悬停在页面上的元素上
    • 输入:selector (字符串):要悬停的元素的 CSS 选择器
  • puppeteer_fill
    • 填写表单字段
    • 输入:
      • selector (字符串):输入字段的 CSS 选择器
      • value (字符串):要填写的值
  • puppeteer_select
    • 选择具有 SELECT 标记的元素
    • 输入:
      • selector (字符串):要选择的元素的 CSS 选择器
  • puppeteer_execute_javascript
    • 在目标上下文中执行 JavaScript 表达式
    • 输入:
      • expression (字符串):要执行的 JavaScript 表达式

资源

  • Console Log:提供控制台日志输出,使用特定 URL 格式访问。
  • Screenshot:提供截屏资源,使用特定 URL 格式访问。

显示服务器详细信息

Wayland 支持

  • 自动检测和配置 Wayland 环境变量。
  • 支持 XWayland 兼容性。

X11 支持

  • 配置 X11 环境变量以支持传统 Linux 显示服务器。

📄 许可证

此项目采用 MIT License,具体信息请参考 LICENSE 文件。

help

运行方式说明

cloud

托管运行

托管运行通常表示这个 MCP Server 由服务方环境承载,用户一般按页面提供的连接方式或授权流程接入,不需要在本地长期启动一个 MCP 进程

  1. 打开服务方连接页
  2. 完成授权或复制端点
  3. 在 MCP 客户端中连接
terminal

本地运行 / 其它方式

本地运行通常需要用户在自己的电脑或服务器上安装依赖,把 server_config 复制到 MCP 客户端,并按 env_schema 补齐环境变量、密钥或其它配置

  1. 复制 server_config
  2. 安装所需依赖
  3. 补齐环境变量后重启客户端