README
🚀 浏览器使用Claude MCP
本项目是一个为AI模型(如Claude和Gemini 2.5)实现浏览器自动化的MCP服务器,可通过自然语言指令提供网页浏览功能,让AI助手能更智能地与网页交互。
🚀 快速开始
本项目实现了Model Context Protocol(MCP)协议的服务器端,赋予AI模型浏览器自动化的能力,使AI助手能够通过自然语言命令浏览网页、与网站交互并提取信息。
详细安装步骤
参见INSTALL.md获取详细的安装和设置说明。以下是快速开始指南:
- 克隆仓库
git clone https://github.com/jasondsmith72/Browser-use-claude-mcp.git cd Browser-use-claude-mcp - 安装依赖项
npm install - 创建
.env文件(以.env.example为模板)cp .env.example .env - 构建项目
npm run build - 启动服务器
npm start
配置说明
参考.env.example文件,可通过环境变量进行配置。例如:
CHROME_PATH:指定Chrome浏览器的路径HEADLESS_CHROME:是否启用无头模式(true/false)
在Claude Desktop中使用
在Claude Desktop中使用本项目,请按照以下步骤操作:
- 打开配置文件,通常位于
~/.config/claude/settings.json - 添加MCP服务器配置:
{ "mcpServers": [ { "name": "Browser Use Claude", "url": "http://localhost:3000" } ] } - 启动Claude Desktop并选择新添加的MCP服务器
✨ 主要特性
🌐 浏览器自动化功能
- 具备完整的浏览器自动化能力,涵盖导航、表单填写、点击等操作。
- 支持网页搜索功能。
- 可进行页面截图,以便获取视觉理解。
- 能够进行内容提取和分析。
🤖 AI相关功能
- 支持多种AI提供商:
- Google Gemini 2.5(主要支持)
- Anthropic Claude
- OpenAI
- 支持图像分析(视觉处理)。
- 具备AI驱动的内容分析能力。
🔧 技术特性
- 使用TypeScript编写,确保代码可靠性。
- 采用模块化架构,职责分离明确。
- 拥有全面的日志记录和错误处理机制。
- 环境变量配置简单易用。
📦 可用工具
| 工具名称 | 描述 |
|----------|------|
| browse_webpage | 访问指定URL并提取其内容 |
| search_web | 执行网页搜索并返回结果 |
| take_screenshot | 捕获当前页面的截图 |
| click_element | 通过文本或选择器点击元素 |
| fill_form | 填写表单字段,使用提供的值 |
| extract_content | 从网页中提取特定内容 |
| analyze_content | 对网页内容进行AI分析 |
💻 使用示例
基础用法
浏览网页
// 示例:访问Google
await browserUseClaude.browseWeb('https://www.google.com');
搜索功能
// 示例:搜索“人工智能”
await browserUseClaude.searchWeb('人工智能');
📚 开发与测试
- 以开发模式运行
npm run dev - 执行测试
npm test - 运行Linter检查代码风格
npm run lint
📄 许可证
项目采用MIT License。
致谢
感谢社区和开源项目的贡献,使此项目得以实现。
扫码联系在线客服