README
🚀 Hume MCP 服务器
Hume MCP 服务器可助力您与 AI 助手协作,轻松打造文本转语音 (TTS) 项目。它能让您在 AI 聊天应用中使用 Octave 文本转语音功能,为项目带来更丰富的交互体验。
Hume 的 MCP 服务器支持您在 AI 聊天应用里使用 Octave 文本转语音 (TTS),您可以借助 MCP 客户端应用程序,例如 Claude Desktop、Cursor 或者 Windsurf 来实现。
Octave TTS 是首个基于大型语言模型 (LLM) 智能的文本转语音系统。它作为一个能够理解上下文含义的语音模型,实现了全新的表达和细腻程度水平。它不仅仅是简单发音,而是对来源文本进行 演绎。
您可以观看 此视频,了解如何使用 MCP 服务器为有声读物中的场景进行配音。
🚀 快速开始
您只需将以下内容复制到客户端的 MCP 配置中(例如,在 claude_desktop_config.json 的 .mcpServers 属性,或者 Cursor 的 mcp.json 里):
{
...
"hume": {
"command": "npx",
"args": [
"@humeai/mcp-server"
],
"env": {
"HUME_API_KEY": "<your_hume_api_key>",
}
}
}
📦 安装指南
先决条件
- 您需要拥有 Hume AI 账户及 API Key,可从 这里 获取。
- 安装 Node.js。
- (可选)安装命令行音频播放器,推荐使用 FFMpeg 的 ffplay,不过服务器会尝试检测并使用几种常见的播放器。
可用工具
服务器提供了以下 MCP 工具:
- tts:从文本合成(并播放)语音。
- play_previous_audio:重放之前生成的音频。
- list_voices:列出可用的语音。
- save_voice:将生成的语音保存到您的库中。
- delete_voice:从您的库中删除语音。
命令行选项
选项:
--workdir, -w <path> 设置音频文件的工作目录 (默认: 系统临时目录)
--(no-)embedded-audio-mode 启用/禁用嵌入式音频模式 (默认: false)
--(no-)instant-mode 启用/禁用即时模式 (默认: false)(curring 10% 的额外费用)
--帮助, -h 显示此帮助消息
📚 详细文档
该项目包含一个 全面的评估框架,用于衡量 AI 代理如何打造文本转语音项目。
🔧 技术细节
环境变量
以下是重要的环境变量:
| 属性 | 详情 |
|------|------|
| HUME_API_KEY | 您的 Hume API Key |
Scan to join WeChat group