article
README
🚀 基于 Google ADK 和 ElevenLabs 的语音播报智能体
本项目借助 Google 的 Agent Development Kit (ADK) 与 ElevenLabs 的 MCP 服务器,构建了一个文本转语音(TTS)的语音播报智能体,为文本语音转换提供了高效的解决方案。
🚀 快速开始
先决条件
- Python 3.11 或更高版本
- ElevenLabs API Key
- Google Gemini API Key
- 已安装的 Google ADK
设置步骤
- 克隆仓库:
git clone <repo-url>
- 创建并激活虚拟环境:
python3.11 -m venv venv
source venv/bin/activate # 在 Windows 上:venv\Scripts\activate
- 安装依赖项:
pip install -r requirements.txt
- 配置 API 密钥:在根目录下创建一个
.env文件,并添加您的 ElevenLabs 和 Gemini API 密钥。
ELEVENLABS_API_KEY=your_api_key_here
GOOGLE_API_KEY = your_api_key_here
运行智能体
- 确保激活了虚拟环境:
source venv/bin/activate
- 切换到 agents 目录:
cd agents
- 使用 ADK 运行智能体。您只能通过网页客户端运行异步智能体:
adk web
智能体将连接到 ElevenLabs 的 MCP 服务器,并准备好处理文本转语音请求(以及其他由 MCP 服务器提供的其他服务工具)
✨ 主要特性
该语音播报智能体通过 uvx 连接到 ElevenLabs 的 MCP 服务器,提供文本转语音功能。它使用了以下技术:
- Google ADK (Agent Development Kit)
- ElevenLabs MCP 服务器
- Python 3.11+
📦 安装指南
详细的安装步骤已在“快速开始”部分的“设置步骤”中说明,这里不再赘述。
📚 详细文档
项目结构
google-adk-sample/
├── agents/
│ └── speaker/
│ ├── agent.py # 主智能体实现
│ └── __init__.py
├── .env # 环境变量
└── requirements.txt # 项目依赖项
故障排除
如果遇到任何问题,可以按照以下步骤排查:
- 确保激活了虚拟环境
- 验证
.env文件中的 API 密钥是否正确设置 - 检查所有依赖项是否正确安装
- 确保从正确的目录运行命令
扫码联系在线客服