金大哥 - google-adk-elevenlabs-mcp MCP 详情

article

README

🚀 基于 Google ADK 和 ElevenLabs 的语音播报智能体

本项目借助 Google 的 Agent Development Kit (ADK) 与 ElevenLabs 的 MCP 服务器，构建了一个文本转语音（TTS）的语音播报智能体，为文本语音转换提供了高效的解决方案。

🚀 快速开始

先决条件

Python 3.11 或更高版本
ElevenLabs API Key
Google Gemini API Key
已安装的 Google ADK

设置步骤

克隆仓库：

git clone <repo-url>

创建并激活虚拟环境：

python3.11 -m venv venv
source venv/bin/activate  # 在 Windows 上：venv\Scripts\activate

安装依赖项：

pip install -r requirements.txt

配置 API 密钥：在根目录下创建一个 .env 文件，并添加您的 ElevenLabs 和 Gemini API 密钥。

ELEVENLABS_API_KEY=your_api_key_here
GOOGLE_API_KEY = your_api_key_here

运行智能体

确保激活了虚拟环境：

source venv/bin/activate

cd agents

使用 ADK 运行智能体。您只能通过网页客户端运行异步智能体：

adk web

智能体将连接到 ElevenLabs 的 MCP 服务器，并准备好处理文本转语音请求（以及其他由 MCP 服务器提供的其他服务工具）

✨ 主要特性

该语音播报智能体通过 uvx 连接到 ElevenLabs 的 MCP 服务器，提供文本转语音功能。它使用了以下技术：

📦 安装指南

详细的安装步骤已在“快速开始”部分的“设置步骤”中说明，这里不再赘述。

📚 详细文档

项目结构

google-adk-sample/
├── agents/
│   └── speaker/
│       ├── agent.py        # 主智能体实现
│       └── __init__.py
├── .env                    # 环境变量
└── requirements.txt        # 项目依赖项

故障排除

如果遇到任何问题，可以按照以下步骤排查：

确保激活了虚拟环境
验证 .env 文件中的 API 密钥是否正确设置
检查所有依赖项是否正确安装
确保从正确的目录运行命令

google-adk-elevenlabs-mcp