金大哥 - fish-speech-mcp MCP 详情

article

README

🚀 鱼语-MCP

鱼语-MCP是一个专门为大型语言模型（LLM）打造的文本到语音合成（TTS）的MCP服务器，能够高效地将文本转化为语音，为LLM提供出色的语音交互能力。

🚀 快速开始

鱼语-MCP服务器可与Dive和其他MCP兼容的LLM一同使用，借助FishSpeech实现文本到语音的转换。您可以按照以下步骤进行安装和配置。

✨ 主要特性

文本转语音：利用FishSpeech技术，将输入的文本精准转换为语音。
保存语音参考：支持保存语音参考，方便后续进行语音克隆操作。
与MCP集成：可与Dive及其他MCP兼容的LLM无缝集成使用。

📦 安装指南

使用Dive桌面

在Dive桌面中点击“+ 添加MCP服务器”。
复制并粘贴以下配置：

{
  "mcpServers": {
    "fish-speech": {
      "command": "npx",
      "args": [
        "-y",
        "@demon24ru/fish-speech-mcp"
      ]
    }
  }
}

点击“保存”以完成MCP服务器的安装。

📚 详细文档

配置

MCP服务器可以通过环境变量进行灵活配置： | 属性 | 详情 | |------|------| | MCP_FISH_SPEECH_SERVER_URL | Optivus服务器的URL（默认：http://localhost:5000） |

工具文档

text_to_speech

功能：使用FishSpeech将文本转换为语音。
输入：
- text (字符串，必需)：要转换为语音的文本。
- reference_id (字符串，可选)：保存语音的标识符。

save_voice_reference

功能：保存语音参考以便将来进行语音克隆。
输入：
- reference_audio (字符串，必需)：用于语音克隆的音频文件路径。
- reference_text (字符串，必需)：与音频文件对应的文本。

🔧 技术细节

与Optivus服务器通信

MCP服务器通过Socket.IO与Optivus服务器进行通信，具体流程如下：

MCP服务器使用Socket.IO客户端连接到Optivus服务器。
请求通过message事件发送到服务器。
响应通过message事件从服务器接收。
MCP服务器能够自动处理连接、重新连接和错误场景。

语音参考

语音参考存储在optivus目录中，每个参考保存在一个具有唯一ID的子目录中。

💻 使用示例

基础用法

让您的LLM执行以下操作：

"将此文本转换为语音：要转换的文本，参考标识符"
"保存语音参考：音频文件路径，与音频文件对应的文本"

手动启动

如果需要，可手动启动服务器，执行以下命令：

npx @demon24ru/fish-speech-mcp

调试

若需要在调试模式下启动服务器，可执行以下命令：

npm run prepare
npx @modelcontextprotocol/inspector node ./lib/index.mjs -y

📄 许可证

本项目采用MIT许可证。

作者

@demon24ru

要求

Node.js 20+版本
MCP兼容的LLM服务

fish-speech-mcp