金大哥 - Browser-use-claude-mcp MCP 详情

article

README

🚀 浏览器使用Claude MCP

本项目是一个为AI模型（如Claude和Gemini 2.5）实现浏览器自动化的MCP服务器，可通过自然语言指令提供网页浏览功能，让AI助手能更智能地与网页交互。

🚀 快速开始

本项目实现了Model Context Protocol（MCP）协议的服务器端，赋予AI模型浏览器自动化的能力，使AI助手能够通过自然语言命令浏览网页、与网站交互并提取信息。

详细安装步骤

参见INSTALL.md获取详细的安装和设置说明。以下是快速开始指南：

克隆仓库

git clone https://github.com/jasondsmith72/Browser-use-claude-mcp.git
cd Browser-use-claude-mcp

安装依赖项
```
npm install
```
创建.env文件（以.env.example为模板）
```
cp .env.example .env
```
构建项目
```
npm run build
```
启动服务器
```
npm start
```

配置说明

参考.env.example文件，可通过环境变量进行配置。例如：

CHROME_PATH：指定Chrome浏览器的路径
HEADLESS_CHROME：是否启用无头模式（true/false）

在Claude Desktop中使用

在Claude Desktop中使用本项目，请按照以下步骤操作：

打开配置文件，通常位于~/.config/claude/settings.json

添加MCP服务器配置：

{
  "mcpServers": [
    {
      "name": "Browser Use Claude",
      "url": "http://localhost:3000"
    }
  ]
}

启动Claude Desktop并选择新添加的MCP服务器

✨ 主要特性

🌐 浏览器自动化功能

具备完整的浏览器自动化能力，涵盖导航、表单填写、点击等操作。
支持网页搜索功能。
可进行页面截图，以便获取视觉理解。
能够进行内容提取和分析。

🤖 AI相关功能

支持多种AI提供商：
- Google Gemini 2.5（主要支持）
- Anthropic Claude
- OpenAI
支持图像分析（视觉处理）。
具备AI驱动的内容分析能力。

🔧 技术特性

使用TypeScript编写，确保代码可靠性。
采用模块化架构，职责分离明确。
拥有全面的日志记录和错误处理机制。
环境变量配置简单易用。

📦 可用工具

| 工具名称 | 描述 | |----------|------| | browse_webpage | 访问指定URL并提取其内容 | | search_web | 执行网页搜索并返回结果 | | take_screenshot | 捕获当前页面的截图 | | click_element | 通过文本或选择器点击元素 | | fill_form | 填写表单字段，使用提供的值 | | extract_content | 从网页中提取特定内容 | | analyze_content | 对网页内容进行AI分析 |

💻 使用示例

基础用法

浏览网页

// 示例：访问Google
await browserUseClaude.browseWeb('https://www.google.com');

搜索功能

// 示例：搜索“人工智能”
await browserUseClaude.searchWeb('人工智能');

📚 开发与测试

以开发模式运行
```
npm run dev
```
执行测试
```
npm test
```
运行Linter检查代码风格
```
npm run lint
```

📄 许可证

项目采用MIT License。

致谢

感谢社区和开源项目的贡献，使此项目得以实现。

Browser-use-claude-mcp