返回 MCP 目录
public公开dns本地运行

jarvis-mcp

Jarvis MCP是一个基于浏览器的语音对话工具,让用户能通过麦克风与AI助手进行自然语音对话,支持30多种语言识别和远程访问,无需额外安装软件或API密钥。

article

README

🚀 Jarvis MCP

让你的人工智能鲜活起来 —— 在浏览器中即刻与智能助手对话。兼容Claude Desktop、OpenCode和其他支持MCP的人工智能工具。

✅ 无需额外软件、服务或API密钥 —— 只需在浏览器中打开网页应用并授予麦克风访问权限。

✨ 主要特性

  • 🎙️ 语音对话:与人工智能助手进行自然的语音交流。
  • 🌍 支持30多种语言:具备多语言语音识别能力。
  • 📱 远程访问:在计算机上运行人工智能时,可通过手机或平板电脑进行访问。
  • ⚙️ 智能控制:拥有可折叠设置、常开模式和自定义语音等功能。
  • ⏱️ 动态超时:根据响应长度智能设置等待时间。
  • 🧰 无需额外软件:完全在浏览器中运行,无需额外安装或API密钥。
  • 🔌 可选的Whisper流式传输:连接到本地Whisper服务器以实现低延迟转录。

📦 安装指南

🚀 一键式安装

Claude Desktop

npx @shantur/jarvis-mcp --install-claude-config
# 重启Claude Desktop即可使用!

OpenCode(当前项目)

npx @shantur/jarvis-mcp --install-opencode-config --local
npx @shantur/jarvis-mcp --install-opencode-plugin --local
# 启动OpenCode并使用对话工具

Claude Code CLI

npx @shantur/jarvis-mcp --install-claude-code-config --local
# 启动Claude Code CLI并使用语音工具

🤖 为何安装OpenCode插件?

  • 即使工具正在运行或任务正在进行中,也能将语音消息流式传输到OpenCode中。
  • 自动转发待处理的Jarvis MCP对话,确保不会错过任何用户请求。
  • 完全在本地运行 —— 无需外部服务,只需你的OpenCode项目和浏览器。
  • 一键安装,并与最新的Jarvis MCP功能保持同步。

📦 手动安装

从NPM安装

npm install -g @shantur/jarvis-mcp
jarvis-mcp

从源代码安装

git clone <repository-url>
cd jarvis-mcp
npm install && npm run build && npm start

💻 使用示例

基础用法

  1. 将其集成到你的人工智能工具中:使用上述安装命令为Claude Desktop、OpenCode或Claude Code注册MCP服务器。
  2. 开启语音交互:从你的助手调用converse工具;Jarvis MCP会在后台自动启动,必要时会打开https://localhost:5114
  3. 允许麦克风访问:首次出现浏览器提示时批准。
  4. 自然对话:每次回复都继续使用converse;Jarvis MCP会处理其余操作。

语音命令在人工智能聊天中的使用

使用converse工具开始对话:
- converse("Hello! How can I help you today?", timeout: 35)

📚 详细文档

浏览器界面

网页界面提供以下功能:

  • 语音设置(点击⚙️展开)
    • 语言选择(30多种选项)
    • 语音选择
    • 语音速度控制
    • 麦克风常开模式
    • 静音检测灵敏度和超时设置(用于Whisper流式传输)
  • 智能控制
    • 在人工智能语音时暂停(防止回声)
    • 用户说话时停止人工智能(实现自然对话)
  • 移动设备友好:可在手机和平板电脑上使用。

远程访问

可从网络中的任何设备进行访问:

  1. 查找计算机的IP地址:在Mac/Linux系统中使用ifconfig | grep inet,在Windows系统中使用ipconfig
  2. 在手机或浏览器中访问https://YOUR_IP:5114
  3. 接受安全警告(自签名证书)。
  4. 授予麦克风权限。 这样就可以在离开办公桌时继续对话!

配置

环境变量

export MCP_VOICE_AUTO_OPEN=false  # 禁用自动打开浏览器
export MCP_VOICE_HTTPS_PORT=5114  # 更改HTTPS端口
export MCP_VOICE_STT_MODE=whisper  # 将网页应用切换到Whisper流式传输模式
export MCP_VOICE_WHISPER_URL=http://localhost:12017/v1/audio/transcriptions  # Whisper端点(完整路径)
export MCP_VOICE_WHISPER_TOKEN=your_token  # 可选的Whisper服务器Bearer认证

Whisper流式传输模式

  • Whisper模式在浏览器中记录原始PCM,将其转换为16 kHz单声道WAV,并通过内置的HTTPS代理进行流式传输,因此本地whisper-server可以处理与OpenAI兼容的请求。
  • 默认情况下,我们代理到标准的whisper-server端点http://localhost:12017/v1/audio/transcriptions;如果你在其他主机或端口运行,可以将MCP_VOICE_WHISPER_URL指向你自己的地址。
  • 当转录正在进行时,用户界面会继续录制,并忽略Whisper的非语音标签(例如[BLANK_AUDIO](typing)),因此只有真实的语音会被排队。
  • 要启用此模式:
    1. 在本地运行你的Whisper服务器(例如pfrankov/whisper-server中的whisper-server)。
    2. 设置上述环境变量(MCP_VOICE_STT_MODE=whisper和完整的MCP_VOICE_WHISPER_URL)。
    3. 重启jarvis-mcp并在浏览器中强制刷新(清空缓存重新加载)以加载流式传输包。
    4. 语音状态(voice_status()工具)现在会报告Whisper或浏览器语音识别是否处于活动状态。

端口

  • HTTPS:5114(麦克风访问必需)
  • HTTP:5113(仅本地访问)

系统要求

  • Node.js 18+
  • Google Chrome(目前仅测试过此浏览器)
  • 麦克风访问权限
  • 可选:本地Whisper服务器(如pfrankov/whisper-server),如果你想通过MCP_VOICE_STT_MODE=whisper实现流式语音识别。

故障排除

  • 移动设备出现证书警告? 点击“高级” → “继续访问该网站”以接受自签名证书。
  • 麦克风无法工作? 确保使用的是HTTPS(而非HTTP),检查浏览器权限,尝试刷新页面。
  • 人工智能不响应语音? 确保正在使用converse工具(而非仅使用speak),检查超时设置是否正确。

开发

npm install
npm run build
npm run dev     # 监听模式
npm run start   # 运行服务器

📄 许可证

本项目采用MIT许可证。

help

运行方式说明

cloud

托管运行

托管运行通常表示这个 MCP Server 由服务方环境承载,用户一般按页面提供的连接方式或授权流程接入,不需要在本地长期启动一个 MCP 进程

  1. 打开服务方连接页
  2. 完成授权或复制端点
  3. 在 MCP 客户端中连接
terminal

本地运行 / 其它方式

本地运行通常需要用户在自己的电脑或服务器上安装依赖,把 server_config 复制到 MCP 客户端,并按 env_schema 补齐环境变量、密钥或其它配置

  1. 复制 server_config
  2. 安装所需依赖
  3. 补齐环境变量后重启客户端