金大哥 - mcp-audio MCP 详情

article

README

🚀 MCP-Audio插件

mcp-audio是一个符合AIO - 2030标准的MCP插件，它利用Audio语音识别API实现语音转文本的转录功能。该插件通过multipart/form-data和base64两种格式公开了identify_voice方法，支持AIO tools.call协议，并返回JSON - RPC结构化输出。

🚀 快速开始

本地环境搭建

1. 克隆并安装依赖

git clone git@github.com:AIO-2030/mcp-audio.git
cd mcp-audio
python -m venv venv && source venv/bin/activate
pip install -r requirements.txt

2. 添加.env文件

cp .env.example .env

设置音频URL和API密钥：

AUDIO_URL=https--xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
API_KEY=sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx

3. 启动MCP服务器

python src/mcp_server.py

4. 使用Docker

4.1 构建并运行容器

docker build -t mcp-audio .
docker run --env-file .env -p 8080:8080 mcp-audio

✨ 主要特性

完全符合AIO标准的MCP插件（支持/tools.call和/help）。
利用SiliconFlow将.wav/.mp3音频文件转换为文本转录。
通过.env文件安全管理API密钥。
兼容Docker，依赖项极少。
可随时向AIO端点注册表进行注册。

📚 详细文档

API概述

POST /api/v1/mcp/voice_model

直接上传音频文件，响应示例如下：

{
  "transcript": "hello world",
  "confidence": 0.91,
  "audio_hash": "a1b2c3..."
}

POST /api/v1/mcp/tools.call (AIO协议)

使用base64编码音频的JSON - RPC格式，响应示例如下：

{
  "method": "tools.call",
  "params": {
    "method": "identify_voice",
    "inputs": [
      {
        "type": "audio",
        "value": "<base64-audio>"
      }
    ]
  }
}

GET /api/v1/mcp/help

自动提供mcp_audio_registration.json的内容，供Queen AI进行MCP发现和服务索引。

测试工具

Base64语音测试

python test/test_audio_base64.py

健康检查

python health_check.py

MCP注册（到AIO端点容器）

./register_mcp.sh

此操作需要jq、dfx和一个正在运行的端点注册表容器。

mcp-audio