README
🚀 浏览器猫 MCP 服务器
浏览器猫 MCP 服务器是一个模型上下文协议服务器,借助 BrowserCat 的云浏览器服务实现浏览器自动化功能。它让大语言模型(LLM)无需安装本地浏览器,就能在真实的浏览器环境中与网页交互、截取截图以及执行 JavaScript。
🚀 快速开始
若要使用浏览器猫 MCP 服务器,需配置相应的环境变量和 NPX 配置,具体步骤如下:
环境变量
BrowserCat MCP 服务器需要以下环境变量:
BROWSERCAT_API_KEY:您的 BrowserCat API 密钥(必需)。您可以在 https://browsercat.xyz/mcp 免费获取一个。
NPX 配置
{
"mcpServers": {
"browsercat": {
"command": "npx",
"args": ["-y", "@browsercatco/mcp-server"],
"env": {
"BROWSERCAT_API_KEY": "your-api-key-here"
}
}
}
}
✨ 主要特性
- 基于云的浏览器自动化
- 无需本地安装浏览器
- 控制台日志监控
- 截图功能
- JavaScript 执行能力
- 基本网页交互(导航、点击、表单填写)
📦 安装指南
安装前,请确保已配置好环境变量和 NPX 配置。具体安装步骤可参考上述“快速开始”部分。
💻 使用示例
基础用法
以下是使用 browsercat_navigate 工具的示例代码:
# 假设存在一个调用工具的函数 call_tool
call_tool('browsercat_navigate', {'url': 'https://example.com'})
高级用法
以下是结合多个工具实现复杂操作的示例代码:
# 导航到网页
call_tool('browsercat_navigate', {'url': 'https://example.com'})
# 填写表单
call_tool('browsercat_fill', {'selector': 'input[type="text"]', 'value': 'example text'})
# 点击按钮
call_tool('browsercat_click', {'selector': 'button[type="submit"]'})
# 截取截图
call_tool('browsercat_screenshot', {'name': 'example_screenshot'})
📚 详细文档
组件
工具
| 工具名称 | 功能 | 输入参数 |
| ---- | ---- | ---- |
| browsercat_navigate | 浏览器跳转到任意 URL | url(字符串) |
| browsercat_screenshot | 截取网页或特定元素的截图 | name(字符串,必需):截屏名称;selector(字符串,可选):用于截取元素的 CSS 选择器;width(数字,可选,默认值为 800):截图宽度;height(数字,可选,默认值为 600):截图高度 |
| browsercat_click | 点击页面上的元素 | selector(字符串):要点击的元素的 CSS 选择器 |
| browsercat_hover | 鼠标悬停在页面上的元素上 | selector(字符串):要悬停的元素的 CSS 选择器 |
| browsercat_fill | 填写表单字段 | selector(字符串):表单字段的 CSS 选择器;value(字符串):填写的值 |
| browsercat_select | 从下拉菜单中选择选项 | selector(字符串):下拉元素的 CSS 选择器;value(字符串):要选择的值 |
| browsercat_evaluate | 在浏览器控制台执行 JavaScript | script(字符串):要执行的 JavaScript 代码 |
资源
服务器提供以下两种类型的资源:
- 控制台日志 (
console://logs)- 浏览器控制台输出文本格式的日志
- 包含浏览器的所有控制台消息
- 截图 (
screenshot://<name>)- 页面的 PNG 图像截屏
- 通过截屏名称访问指定的截图
📄 许可证
此 MCP 服务器根据 MIT 许可证发布。这意味着您可以自由地使用、修改和分发软件,但需遵守 MIT 许可证的条款和条件。有关详细信息,请参阅项目存储库中的 LICENSE 文件。
Scan to join WeChat group