返回 MCP 目录
public公开dns本地运行

google-adk-elevenlabs-mcp

该项目使用Google ADK和ElevenLabs MCP服务器构建了一个文本转语音(TTS)的智能体,通过uvx连接实现语音合成功能。

article

README

🚀 基于 Google ADK 和 ElevenLabs 的语音播报智能体

本项目借助 Google 的 Agent Development Kit (ADK) 与 ElevenLabs 的 MCP 服务器,构建了一个文本转语音(TTS)的语音播报智能体,为文本语音转换提供了高效的解决方案。

🚀 快速开始

先决条件

  • Python 3.11 或更高版本
  • ElevenLabs API Key
  • Google Gemini API Key
  • 已安装的 Google ADK

设置步骤

  1. 克隆仓库
git clone <repo-url>
  1. 创建并激活虚拟环境
python3.11 -m venv venv
source venv/bin/activate  # 在 Windows 上:venv\Scripts\activate
  1. 安装依赖项
pip install -r requirements.txt
  1. 配置 API 密钥:在根目录下创建一个 .env 文件,并添加您的 ElevenLabs 和 Gemini API 密钥。
ELEVENLABS_API_KEY=your_api_key_here
GOOGLE_API_KEY = your_api_key_here

运行智能体

  1. 确保激活了虚拟环境:
source venv/bin/activate
  1. 切换到 agents 目录:
cd agents
  1. 使用 ADK 运行智能体。您只能通过网页客户端运行异步智能体:
adk web

智能体将连接到 ElevenLabs 的 MCP 服务器,并准备好处理文本转语音请求(以及其他由 MCP 服务器提供的其他服务工具)

✨ 主要特性

该语音播报智能体通过 uvx 连接到 ElevenLabs 的 MCP 服务器,提供文本转语音功能。它使用了以下技术:

📦 安装指南

详细的安装步骤已在“快速开始”部分的“设置步骤”中说明,这里不再赘述。

📚 详细文档

项目结构

google-adk-sample/
├── agents/
│   └── speaker/
│       ├── agent.py        # 主智能体实现
│       └── __init__.py
├── .env                    # 环境变量
└── requirements.txt        # 项目依赖项

故障排除

如果遇到任何问题,可以按照以下步骤排查:

  1. 确保激活了虚拟环境
  2. 验证 .env 文件中的 API 密钥是否正确设置
  3. 检查所有依赖项是否正确安装
  4. 确保从正确的目录运行命令

更多资源

help

运行方式说明

cloud

托管运行

托管运行通常表示这个 MCP Server 由服务方环境承载,用户一般按页面提供的连接方式或授权流程接入,不需要在本地长期启动一个 MCP 进程

  1. 打开服务方连接页
  2. 完成授权或复制端点
  3. 在 MCP 客户端中连接
terminal

本地运行 / 其它方式

本地运行通常需要用户在自己的电脑或服务器上安装依赖,把 server_config 复制到 MCP 客户端,并按 env_schema 补齐环境变量、密钥或其它配置

  1. 复制 server_config
  2. 安装所需依赖
  3. 补齐环境变量后重启客户端