article
README
🚀 Voicevox MCP 服务器
Voicevox MCP 服务器是一个互操作性语音合成服务器,它通过 Model Context Protocol (MCP) 利用 VOICEVOX、AivisSpeech、COEIROINK 的语音合成技术。该服务器适用于在 Cursor 等工具中使用 Claude 3.7 的代理模式下进行语音合成。
🚀 快速开始
先决条件
Windows 环境
- Node.js 18 或更高版本
- VOICEVOX ENGINE(在 http://localhost:50000 等本地运行)
- VLC 媒体播放器(已配置路径)
Docker 环境 (WSL2)
- Docker 和 Docker Compose
- WSL2
- VOICEVOX ENGINE(本地或 Docker 中运行)
- 已安装
sudo apt install libsdl2-dev pulseaudio-utils pulseaudio的 Linux 环境 - 对
/mnt/wslg的访问权限
安装与设置
- 克隆仓库
git clone https://github.com/Dosugamea/voicevox-mcp-server.git
cd voicevox-mcp-server
- 依赖项安装
npm install
- 环境变量配置
将
.env_example复制并重命名为.env文件,根据需要修改设置:
VOICEVOX_API_URL=http://localhost:50021
VOICEVOX_SPEAKER_ID=1
执行方法
Windows 环境执行
在编辑器中分别执行以下步骤启动服务器:
npm run build
npm start
Docker 环境执行
在编辑器中无需额外操作。由于是 stdio 模式,无法直接运行。
设置方法
Windows 环境执行时
在 mcp.json 中添加以下内容:
为避免连接不稳定导致断开,请确保自动重新连接。
"voicevox": {
"url": "http://localhost:10100/sse"
}
Docker 环境执行时
在 mcp.json 中添加以下内容:
(作者环境尚未确认是否正常工作)
{
"tools": {
"voicevox": {
"command": "cmd",
"args": [
"/c",
"docker",
"run",
"-i",
"--rm",
"-v",
"/mnt/wslg:/mnt/wslg",
"-e",
"PULSE_SERVER",
"-e",
"SDL_AUDIODRIVER",
"-e",
"VOICEVOX_API_URL",
"-e",
"VOICEVOX_SPEAKER_ID",
"your-local-docker-image-name"
],
"env": {
"PULSE_SERVER": "unix:/mnt/wslg/PulseServer",
"SDL_AUDIODRIVER": "pulseaudio",
"VOICEVOX_API_URL": "http://host.docker.internal:50031",
"VOICEVOX_SPEAKER_ID": "919692871"
}
}
}
}
📚 详细文档
话者 ID
话者 ID 根据使用的 VOICEVOX 模型而异。默认使用「1」(四国めたん)。如需使用其他话者 ID,请修改环境变量 VOICEVOX_SPEAKER_ID。
话者 ID 的列表可通过 VOICEVOX ENGINE API 的 /speakers 端点确认。
例如: curl http://localhost:50021/speakers
问题排除
- VOICEVOX 连接错误:确认 VOICEVOX ENGINE 已启动,且 API URL 正确配置。
- 音频未播放:确认 VLC 已正确安装并配置了路径。
- Docker 环境下的音频输出问题:检查 pulseaudio 的设置是否正确。
开发者信息
- 如需贡献代码,请创建 Issue 或提交 Pull Request。
- 有关错误报告或功能请求,请使用 GitHub 的 Issue 功能。
📄 许可证
本项目采用 MIT License。
扫码联系在线客服