README
🚀 语音通话 MCP 服务器
语音通话 MCP 服务器是一个模型上下文协议(MCP)服务器,支持通过语音进行通话,并与 AI 模型实时交互。用户能以自然语言进行对话,AI 可实时生成和理解语音内容。
🚀 快速开始
语音通话 MCP 服务器是一个用于处理语音通话的系统,支持与 AI 模型实时交互。用户可以通过自然语言进行对话,AI 可以实时生成和理解语音内容。
安装步骤
通过 npm 安装
npm install -g voice-call-mcp-server
初始化项目
voice-call-mcp-server init
启动服务器
voice-call-mcp-server start
环境变量
以下是需要设置的环境变量:
TWILIO_ACCOUNT_SID:你的 Twilio 账户 IDTWILIO_AUTH_TOKEN:你的 Twilio 认证令牌OPENAI_API_KEY:你的 OpenAI API 密钥NGROK_AUTHTOKEN:你的 Ngrok 自动化令牌
Claude Desktop 配置
在 Claude Desktop 中进行如下配置:
- 打开设置菜单
- 选择插件管理
- 启用语音通话功能
- 输入相关 API 凭据
✨ 主要特性
- 语音通话支持:用户可以通过电话号码进行语音通话。
- AI 实时交互:与 AI 模型实时对话,支持多语言交流。
- 自然语言处理:支持复杂的对话场景和指令执行。
- 可扩展性:支持多种 AI 模型的集成。
📚 详细文档
序列图
sequenceDiagram
participant 用户 as User
participant 服务器 as Server
participant AI 模型 as AI Model
User->Server:发起语音通话请求
Server->AI Model:传递语音数据进行处理
AI Model-->>Server:返回生成的语音响应
Server-->>User:发送语音响应
为什么使用 MCP?
MCP 提供了一个统一的接口,方便开发者快速接入语音通话功能,并与 AI 模型进行交互。它简化了通信协议和数据处理流程。
配置要求
- 操作系统:Linux 或 macOS(推荐)
- Node.js 版本:v14 或更高版本
- Python 版本:3.6 或更高版本
- 端口要求:需要开放特定端口用于通信
示例互动
示例 1: 基本对话
用户:今天天气怎么样?
AI:您好,建议您联网获取时效性较强的信息;如需其他帮助,请随时告诉我。
示例 2: 多语言支持
User: Wie ist das Wetter heute?
AI: Bitte vereinfachen Sie die Anfrage auf Mandarin. Danke!
注意事项
- 电话号码格式:所有电话号码必须使用 E.164 格式(例如:+1234567890)
- 速率限制:请注意 Twilio 和 OpenAI 账户的速率限制和定价策略
- 语音对话:AI 可以处理自然语言对话
- 通话时长:注意控制通话时长,以免产生额外费用
- 公共暴露:Ngrok 隧道会公开服务器(带有随机 URL 和保护密钥)
常见问题解答
-
“电话号码必须使用 E.164 格式”
- 确保电话号码以“+”开头,并包含国家代码
-
“无效凭证”
- 检查
TWILIO_ACCOUNT_SID和TWILIO_AUTH_TOKEN是否正确。可以在 Twilio 控台复制。
- 检查
-
“OpenAI API 错误”
- 验证
OPENAI_API_KEY是否有效
- 验证
-
“无法连接到 Ngrok 服务”
- 检查 Ngrok 令牌是否正确,确保隧道已建立
贡献指南
欢迎贡献代码和文档。请参考项目仓库中的贡献指南。
安全提示
- 禁止在公共网络中明文传输敏感信息
- 定期更新 API 凭据
- 配置适当的安全策略
招聘启示
我们正在寻找优秀的开发人员和产品经理,加入我们的团队。
📄 许可证
本项目采用 MIT 许可证。详细信息请查看 LICENSE 文件。
如需了解更多信息,请访问项目文档或联系支持团队。
Scan to contact