返回 MCP 目录
public公开dns本地运行

mcp-audio

mcp-audio是一个符合AIO-2030标准的MCP插件,提供语音转文字功能,支持多种音频格式和API调用方式。

article

README

🚀 MCP-Audio插件

mcp-audio是一个符合AIO - 2030标准的MCP插件,它利用Audio语音识别API实现语音转文本的转录功能。该插件通过multipart/form-database64两种格式公开了identify_voice方法,支持AIO tools.call协议,并返回JSON - RPC结构化输出。

🚀 快速开始

本地环境搭建

1. 克隆并安装依赖

git clone git@github.com:AIO-2030/mcp-audio.git
cd mcp-audio
python -m venv venv && source venv/bin/activate
pip install -r requirements.txt

2. 添加.env文件

cp .env.example .env

设置音频URL和API密钥:

AUDIO_URL=https--xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
API_KEY=sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx

3. 启动MCP服务器

python src/mcp_server.py

4. 使用Docker

4.1 构建并运行容器
docker build -t mcp-audio .
docker run --env-file .env -p 8080:8080 mcp-audio

✨ 主要特性

  • 完全符合AIO标准的MCP插件(支持/tools.call/help)。
  • 利用SiliconFlow将.wav/.mp3音频文件转换为文本转录。
  • 通过.env文件安全管理API密钥。
  • 兼容Docker,依赖项极少。
  • 可随时向AIO端点注册表进行注册。

📚 详细文档

API概述

POST /api/v1/mcp/voice_model

直接上传音频文件,响应示例如下:

{
  "transcript": "hello world",
  "confidence": 0.91,
  "audio_hash": "a1b2c3..."
}

POST /api/v1/mcp/tools.call (AIO协议)

使用base64编码音频的JSON - RPC格式,响应示例如下:

{
  "method": "tools.call",
  "params": {
    "method": "identify_voice",
    "inputs": [
      {
        "type": "audio",
        "value": "<base64-audio>"
      }
    ]
  }
}

GET /api/v1/mcp/help

自动提供mcp_audio_registration.json的内容,供Queen AI进行MCP发现和服务索引。

测试工具

Base64语音测试

python test/test_audio_base64.py

健康检查

python health_check.py

MCP注册(到AIO端点容器)

./register_mcp.sh

此操作需要jqdfx和一个正在运行的端点注册表容器。

help

运行方式说明

cloud

托管运行

托管运行通常表示这个 MCP Server 由服务方环境承载,用户一般按页面提供的连接方式或授权流程接入,不需要在本地长期启动一个 MCP 进程

  1. 打开服务方连接页
  2. 完成授权或复制端点
  3. 在 MCP 客户端中连接
terminal

本地运行 / 其它方式

本地运行通常需要用户在自己的电脑或服务器上安装依赖,把 server_config 复制到 MCP 客户端,并按 env_schema 补齐环境变量、密钥或其它配置

  1. 复制 server_config
  2. 安装所需依赖
  3. 补齐环境变量后重启客户端