返回 MCP 目录
public公开dns本地运行

playwright-agent

一个基于AgentKit的多智能体浏览器自动化框架,通过分工协作实现智能网页导航与任务执行,包含任务规划、导航控制、浏览器操作和结果验证四大核心模块。

article

README

🚀 AgentKit 浏览器自动化框架

AgentKit 浏览器自动化框架是一个基于 AgentKit 构建的高级工具,它借助多智能体系统,实现了智能网页导航与任务执行,能有效解决浏览器自动化操作中的复杂任务处理难题,为用户提供高效、智能的自动化体验。

🚀 快速开始

依赖项

  • Node.js(v14 或更高版本)
  • npm 或 yarn
  • OpenAI API 密钥(用于 GPT 模型)

安装

  1. 克隆仓库:
git clone https://github.com/tmahesh/playwright-agent.git
cd playwright-agent
  1. 安装依赖项:
npm install
  1. 设置环境变量:
cp .env.sample .env
# 使用 OpenAI API 密钥和其他配置编辑 .env 文件
  1. 在不同的终端运行以下命令:index.ts、playwright - mcp、inngest - cli
npx @playwright/mcp@latest --port 8931
npx tsx index.ts
npx inngest-cli@latest dev --no-discovery -u http://localhost:3000/api/inngest -v

✨ 主要特性

  • 智能任务规划:能够将复杂任务分解为可管理步骤。
  • 状态管理:可跟踪浏览器状态和操作结果。
  • 错误处理:具备强大的错误处理和恢复机制。
  • 事件系统:拥有全面的事件记录和监控功能。
  • 灵活动作系统:具备可扩展的动作注册表以支持自定义行为。
  • 验证框架:内置验证功能以确认任务完成情况。
  • 内存管理:可维护操作上下文和历史记录。

📚 详细文档

概述

该项目实现了基于 AgentKit 的多智能体系统,用于浏览器自动化。不同的代理协同工作,实现以下目标:

  • 规划并分解任务
  • 导航网页
  • 执行浏览器操作
  • 验证结果

架构(待定)

该系统由四个专门化的代理组成:

  1. 规划代理
    • 将任务分解为可执行步骤。
    • 创建详细的执行计划。
    • 确定任务完成标准。
  2. 导航代理
    • 确定下一步操作。
    • 管理状态转换。
    • 处理动作执行。
    • 提供详细日志和反馈。
  3. 浏览器代理
    • 执行浏览器自动化操作。
    • 与网页元素交互。
    • 处理页面导航。
    • 管理浏览器状态。
  4. 验证代理
    • 验证任务完成情况。
    • 核实结果。
    • 处理错误情况。
    • 提供成功/失败反馈。

🤝 贡献指南

  1. 叉叉克隆仓库。
  2. 创建功能分支。
  3. 提交更改。
  4. 推送到分支。
  5. 创建拉取请求。
help

运行方式说明

cloud

托管运行

托管运行通常表示这个 MCP Server 由服务方环境承载,用户一般按页面提供的连接方式或授权流程接入,不需要在本地长期启动一个 MCP 进程

  1. 打开服务方连接页
  2. 完成授权或复制端点
  3. 在 MCP 客户端中连接
terminal

本地运行 / 其它方式

本地运行通常需要用户在自己的电脑或服务器上安装依赖,把 server_config 复制到 MCP 客户端,并按 env_schema 补齐环境变量、密钥或其它配置

  1. 复制 server_config
  2. 安装所需依赖
  3. 补齐环境变量后重启客户端