article
README
🚀 Jarvis MCP
让你的人工智能鲜活起来 —— 在浏览器中即刻与智能助手对话。兼容Claude Desktop、OpenCode和其他支持MCP的人工智能工具。
✅ 无需额外软件、服务或API密钥 —— 只需在浏览器中打开网页应用并授予麦克风访问权限。
✨ 主要特性
- 🎙️ 语音对话:与人工智能助手进行自然的语音交流。
- 🌍 支持30多种语言:具备多语言语音识别能力。
- 📱 远程访问:在计算机上运行人工智能时,可通过手机或平板电脑进行访问。
- ⚙️ 智能控制:拥有可折叠设置、常开模式和自定义语音等功能。
- ⏱️ 动态超时:根据响应长度智能设置等待时间。
- 🧰 无需额外软件:完全在浏览器中运行,无需额外安装或API密钥。
- 🔌 可选的Whisper流式传输:连接到本地Whisper服务器以实现低延迟转录。
📦 安装指南
🚀 一键式安装
Claude Desktop:
npx @shantur/jarvis-mcp --install-claude-config
# 重启Claude Desktop即可使用!
OpenCode(当前项目):
npx @shantur/jarvis-mcp --install-opencode-config --local
npx @shantur/jarvis-mcp --install-opencode-plugin --local
# 启动OpenCode并使用对话工具
Claude Code CLI:
npx @shantur/jarvis-mcp --install-claude-code-config --local
# 启动Claude Code CLI并使用语音工具
🤖 为何安装OpenCode插件?
- 即使工具正在运行或任务正在进行中,也能将语音消息流式传输到OpenCode中。
- 自动转发待处理的Jarvis MCP对话,确保不会错过任何用户请求。
- 完全在本地运行 —— 无需外部服务,只需你的OpenCode项目和浏览器。
- 一键安装,并与最新的Jarvis MCP功能保持同步。
📦 手动安装
从NPM安装:
npm install -g @shantur/jarvis-mcp
jarvis-mcp
从源代码安装:
git clone <repository-url>
cd jarvis-mcp
npm install && npm run build && npm start
💻 使用示例
基础用法
- 将其集成到你的人工智能工具中:使用上述安装命令为Claude Desktop、OpenCode或Claude Code注册MCP服务器。
- 开启语音交互:从你的助手调用
converse工具;Jarvis MCP会在后台自动启动,必要时会打开https://localhost:5114。 - 允许麦克风访问:首次出现浏览器提示时批准。
- 自然对话:每次回复都继续使用
converse;Jarvis MCP会处理其余操作。
语音命令在人工智能聊天中的使用
使用converse工具开始对话:
- converse("Hello! How can I help you today?", timeout: 35)
📚 详细文档
浏览器界面
网页界面提供以下功能:
- 语音设置(点击⚙️展开)
- 语言选择(30多种选项)
- 语音选择
- 语音速度控制
- 麦克风常开模式
- 静音检测灵敏度和超时设置(用于Whisper流式传输)
- 智能控制
- 在人工智能语音时暂停(防止回声)
- 用户说话时停止人工智能(实现自然对话)
- 移动设备友好:可在手机和平板电脑上使用。
远程访问
可从网络中的任何设备进行访问:
- 查找计算机的IP地址:在Mac/Linux系统中使用
ifconfig | grep inet,在Windows系统中使用ipconfig。 - 在手机或浏览器中访问
https://YOUR_IP:5114。 - 接受安全警告(自签名证书)。
- 授予麦克风权限。 这样就可以在离开办公桌时继续对话!
配置
环境变量
export MCP_VOICE_AUTO_OPEN=false # 禁用自动打开浏览器
export MCP_VOICE_HTTPS_PORT=5114 # 更改HTTPS端口
export MCP_VOICE_STT_MODE=whisper # 将网页应用切换到Whisper流式传输模式
export MCP_VOICE_WHISPER_URL=http://localhost:12017/v1/audio/transcriptions # Whisper端点(完整路径)
export MCP_VOICE_WHISPER_TOKEN=your_token # 可选的Whisper服务器Bearer认证
Whisper流式传输模式
- Whisper模式在浏览器中记录原始PCM,将其转换为16 kHz单声道WAV,并通过内置的HTTPS代理进行流式传输,因此本地
whisper-server可以处理与OpenAI兼容的请求。 - 默认情况下,我们代理到标准的
whisper-server端点http://localhost:12017/v1/audio/transcriptions;如果你在其他主机或端口运行,可以将MCP_VOICE_WHISPER_URL指向你自己的地址。 - 当转录正在进行时,用户界面会继续录制,并忽略Whisper的非语音标签(例如
[BLANK_AUDIO]、(typing)),因此只有真实的语音会被排队。 - 要启用此模式:
- 在本地运行你的Whisper服务器(例如
pfrankov/whisper-server中的whisper-server)。 - 设置上述环境变量(
MCP_VOICE_STT_MODE=whisper和完整的MCP_VOICE_WHISPER_URL)。 - 重启
jarvis-mcp并在浏览器中强制刷新(清空缓存重新加载)以加载流式传输包。 - 语音状态(
voice_status()工具)现在会报告Whisper或浏览器语音识别是否处于活动状态。
- 在本地运行你的Whisper服务器(例如
端口
- HTTPS:5114(麦克风访问必需)
- HTTP:5113(仅本地访问)
系统要求
- Node.js 18+
- Google Chrome(目前仅测试过此浏览器)
- 麦克风访问权限
- 可选:本地Whisper服务器(如
pfrankov/whisper-server),如果你想通过MCP_VOICE_STT_MODE=whisper实现流式语音识别。
故障排除
- 移动设备出现证书警告? 点击“高级” → “继续访问该网站”以接受自签名证书。
- 麦克风无法工作? 确保使用的是HTTPS(而非HTTP),检查浏览器权限,尝试刷新页面。
- 人工智能不响应语音?
确保正在使用
converse工具(而非仅使用speak),检查超时设置是否正确。
开发
npm install
npm run build
npm run dev # 监听模式
npm run start # 运行服务器
📄 许可证
本项目采用MIT许可证。
微信扫一扫