article
README
🚀 MCP-Audio插件
mcp-audio是一个符合AIO - 2030标准的MCP插件,它利用Audio语音识别API实现语音转文本的转录功能。该插件通过multipart/form-data和base64两种格式公开了identify_voice方法,支持AIO tools.call协议,并返回JSON - RPC结构化输出。
🚀 快速开始
本地环境搭建
1. 克隆并安装依赖
git clone git@github.com:AIO-2030/mcp-audio.git
cd mcp-audio
python -m venv venv && source venv/bin/activate
pip install -r requirements.txt
2. 添加.env文件
cp .env.example .env
设置音频URL和API密钥:
AUDIO_URL=https--xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
API_KEY=sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
3. 启动MCP服务器
python src/mcp_server.py
4. 使用Docker
4.1 构建并运行容器
docker build -t mcp-audio .
docker run --env-file .env -p 8080:8080 mcp-audio
✨ 主要特性
- 完全符合AIO标准的MCP插件(支持
/tools.call和/help)。 - 利用SiliconFlow将
.wav/.mp3音频文件转换为文本转录。 - 通过
.env文件安全管理API密钥。 - 兼容Docker,依赖项极少。
- 可随时向AIO端点注册表进行注册。
📚 详细文档
API概述
POST /api/v1/mcp/voice_model
直接上传音频文件,响应示例如下:
{
"transcript": "hello world",
"confidence": 0.91,
"audio_hash": "a1b2c3..."
}
POST /api/v1/mcp/tools.call (AIO协议)
使用base64编码音频的JSON - RPC格式,响应示例如下:
{
"method": "tools.call",
"params": {
"method": "identify_voice",
"inputs": [
{
"type": "audio",
"value": "<base64-audio>"
}
]
}
}
GET /api/v1/mcp/help
自动提供mcp_audio_registration.json的内容,供Queen AI进行MCP发现和服务索引。
测试工具
Base64语音测试
python test/test_audio_base64.py
健康检查
python health_check.py
MCP注册(到AIO端点容器)
./register_mcp.sh
此操作需要jq、dfx和一个正在运行的端点注册表容器。
微信扫一扫