返回 MCP 目录
public公开dns本地运行

fish-speech-mcp

一个基于FishSpeech的文本转语音(TTS)MCP服务器,支持语音参考保存,可与Dive等MCP兼容的LLM集成使用。

article

README

🚀 鱼语-MCP

鱼语-MCP是一个专门为大型语言模型(LLM)打造的文本到语音合成(TTS)的MCP服务器,能够高效地将文本转化为语音,为LLM提供出色的语音交互能力。

🚀 快速开始

鱼语-MCP服务器可与Dive和其他MCP兼容的LLM一同使用,借助FishSpeech实现文本到语音的转换。您可以按照以下步骤进行安装和配置。

✨ 主要特性

  • 文本转语音:利用FishSpeech技术,将输入的文本精准转换为语音。
  • 保存语音参考:支持保存语音参考,方便后续进行语音克隆操作。
  • 与MCP集成:可与Dive及其他MCP兼容的LLM无缝集成使用。

📦 安装指南

使用Dive桌面

  1. 在Dive桌面中点击“+ 添加MCP服务器”。
  2. 复制并粘贴以下配置:
{
  "mcpServers": {
    "fish-speech": {
      "command": "npx",
      "args": [
        "-y",
        "@demon24ru/fish-speech-mcp"
      ]
    }
  }
}
  1. 点击“保存”以完成MCP服务器的安装。

📚 详细文档

配置

MCP服务器可以通过环境变量进行灵活配置: | 属性 | 详情 | |------|------| | MCP_FISH_SPEECH_SERVER_URL | Optivus服务器的URL(默认:http://localhost:5000) |

工具文档

text_to_speech

  • 功能:使用FishSpeech将文本转换为语音。
  • 输入
    • text (字符串,必需):要转换为语音的文本。
    • reference_id (字符串,可选):保存语音的标识符。

save_voice_reference

  • 功能:保存语音参考以便将来进行语音克隆。
  • 输入
    • reference_audio (字符串,必需):用于语音克隆的音频文件路径。
    • reference_text (字符串,必需):与音频文件对应的文本。

🔧 技术细节

与Optivus服务器通信

MCP服务器通过Socket.IO与Optivus服务器进行通信,具体流程如下:

  1. MCP服务器使用Socket.IO客户端连接到Optivus服务器。
  2. 请求通过message事件发送到服务器。
  3. 响应通过message事件从服务器接收。
  4. MCP服务器能够自动处理连接、重新连接和错误场景。

语音参考

语音参考存储在optivus目录中,每个参考保存在一个具有唯一ID的子目录中。

💻 使用示例

基础用法

让您的LLM执行以下操作:

"将此文本转换为语音:要转换的文本,参考标识符"
"保存语音参考:音频文件路径,与音频文件对应的文本"

手动启动

如果需要,可手动启动服务器,执行以下命令:

npx @demon24ru/fish-speech-mcp

调试

若需要在调试模式下启动服务器,可执行以下命令:

npm run prepare
npx @modelcontextprotocol/inspector node ./lib/index.mjs -y

📄 许可证

本项目采用MIT许可证。

作者

@demon24ru

要求

  • Node.js 20+版本
  • MCP兼容的LLM服务
help

运行方式说明

cloud

托管运行

托管运行通常表示这个 MCP Server 由服务方环境承载,用户一般按页面提供的连接方式或授权流程接入,不需要在本地长期启动一个 MCP 进程

  1. 打开服务方连接页
  2. 完成授权或复制端点
  3. 在 MCP 客户端中连接
terminal

本地运行 / 其它方式

本地运行通常需要用户在自己的电脑或服务器上安装依赖,把 server_config 复制到 MCP 客户端,并按 env_schema 补齐环境变量、密钥或其它配置

  1. 复制 server_config
  2. 安装所需依赖
  3. 补齐环境变量后重启客户端