article

README

🚀 Hume MCP 服务器

Hume MCP 服务器可助力您与 AI 助手协作，轻松打造文本转语音 (TTS) 项目。它能让您在 AI 聊天应用中使用 Octave 文本转语音功能，为项目带来更丰富的交互体验。

Hume MCP Server

与 AI 助手协作，打造您的文本转语音 (TTS) 项目

📘 文档 • 💬 加入我们的 Discord • 🔐 获取您的 API Key

Hume 的 MCP 服务器支持您在 AI 聊天应用里使用 Octave 文本转语音 (TTS)，您可以借助 MCP 客户端应用程序，例如 Claude Desktop、Cursor 或者 Windsurf 来实现。

Octave TTS 是首个基于大型语言模型 (LLM) 智能的文本转语音系统。它作为一个能够理解上下文含义的语音模型，实现了全新的表达和细腻程度水平。它不仅仅是简单发音，而是对来源文本进行演绎。

您可以观看此视频，了解如何使用 MCP 服务器为有声读物中的场景进行配音。

🚀 快速开始

您只需将以下内容复制到客户端的 MCP 配置中（例如，在 claude_desktop_config.json 的 .mcpServers 属性，或者 Cursor 的 mcp.json 里）：

{
    ...
    "hume": {
        "command": "npx",
        "args": [
            "@humeai/mcp-server"
        ],
        "env": {
            "HUME_API_KEY": "<your_hume_api_key>",
        }
    }
}

📦 安装指南

先决条件

您需要拥有 Hume AI 账户及 API Key，可从这里获取。
安装 Node.js。
（可选）安装命令行音频播放器，推荐使用 FFMpeg 的 ffplay，不过服务器会尝试检测并使用几种常见的播放器。

可用工具

服务器提供了以下 MCP 工具：

tts：从文本合成（并播放）语音。
play_previous_audio：重放之前生成的音频。
list_voices：列出可用的语音。
save_voice：将生成的语音保存到您的库中。
delete_voice：从您的库中删除语音。

命令行选项

选项:
  --workdir, -w <path>       设置音频文件的工作目录 (默认: 系统临时目录)
  --(no-)embedded-audio-mode 启用/禁用嵌入式音频模式 (默认: false)
  --(no-)instant-mode        启用/禁用即时模式 (默认: false)（curring 10% 的额外费用）
  --帮助, -h                 显示此帮助消息

📚 详细文档

该项目包含一个全面的评估框架，用于衡量 AI 代理如何打造文本转语音项目。

🔧 技术细节

环境变量

以下是重要的环境变量： | 属性 | 详情 | |------|------| | HUME_API_KEY | 您的 Hume API Key |

mcp-server-hume