金大哥 - jarvis-mcp MCP 详情

article

README

🚀 Jarvis MCP

让你的人工智能鲜活起来 —— 在浏览器中即刻与智能助手对话。兼容Claude Desktop、OpenCode和其他支持MCP的人工智能工具。

✅ 无需额外软件、服务或API密钥 —— 只需在浏览器中打开网页应用并授予麦克风访问权限。

✨ 主要特性

🎙️ 语音对话：与人工智能助手进行自然的语音交流。
🌍 支持30多种语言：具备多语言语音识别能力。
📱 远程访问：在计算机上运行人工智能时，可通过手机或平板电脑进行访问。
⚙️ 智能控制：拥有可折叠设置、常开模式和自定义语音等功能。
⏱️ 动态超时：根据响应长度智能设置等待时间。
🧰 无需额外软件：完全在浏览器中运行，无需额外安装或API密钥。
🔌 可选的Whisper流式传输：连接到本地Whisper服务器以实现低延迟转录。

📦 安装指南

🚀 一键式安装

Claude Desktop：

npx @shantur/jarvis-mcp --install-claude-config
# 重启Claude Desktop即可使用！

OpenCode（当前项目）：

npx @shantur/jarvis-mcp --install-opencode-config --local
npx @shantur/jarvis-mcp --install-opencode-plugin --local
# 启动OpenCode并使用对话工具

Claude Code CLI：

npx @shantur/jarvis-mcp --install-claude-code-config --local
# 启动Claude Code CLI并使用语音工具

🤖 为何安装OpenCode插件？

即使工具正在运行或任务正在进行中，也能将语音消息流式传输到OpenCode中。
自动转发待处理的Jarvis MCP对话，确保不会错过任何用户请求。
完全在本地运行 —— 无需外部服务，只需你的OpenCode项目和浏览器。
一键安装，并与最新的Jarvis MCP功能保持同步。

📦 手动安装

从NPM安装：

npm install -g @shantur/jarvis-mcp
jarvis-mcp

从源代码安装：

git clone <repository-url>
cd jarvis-mcp
npm install && npm run build && npm start

💻 使用示例

基础用法

将其集成到你的人工智能工具中：使用上述安装命令为Claude Desktop、OpenCode或Claude Code注册MCP服务器。
开启语音交互：从你的助手调用converse工具；Jarvis MCP会在后台自动启动，必要时会打开https://localhost:5114。
允许麦克风访问：首次出现浏览器提示时批准。
自然对话：每次回复都继续使用converse；Jarvis MCP会处理其余操作。

语音命令在人工智能聊天中的使用

使用converse工具开始对话：
- converse("Hello! How can I help you today?", timeout: 35)

📚 详细文档

浏览器界面

网页界面提供以下功能：

语音设置（点击⚙️展开）
- 语言选择（30多种选项）
- 语音选择
- 语音速度控制
- 麦克风常开模式
- 静音检测灵敏度和超时设置（用于Whisper流式传输）
智能控制
- 在人工智能语音时暂停（防止回声）
- 用户说话时停止人工智能（实现自然对话）
移动设备友好：可在手机和平板电脑上使用。

远程访问

可从网络中的任何设备进行访问：

查找计算机的IP地址：在Mac/Linux系统中使用ifconfig | grep inet，在Windows系统中使用ipconfig。
在手机或浏览器中访问https://YOUR_IP:5114。
接受安全警告（自签名证书）。
授予麦克风权限。这样就可以在离开办公桌时继续对话！

配置

环境变量

export MCP_VOICE_AUTO_OPEN=false  # 禁用自动打开浏览器
export MCP_VOICE_HTTPS_PORT=5114  # 更改HTTPS端口
export MCP_VOICE_STT_MODE=whisper  # 将网页应用切换到Whisper流式传输模式
export MCP_VOICE_WHISPER_URL=http://localhost:12017/v1/audio/transcriptions  # Whisper端点（完整路径）
export MCP_VOICE_WHISPER_TOKEN=your_token  # 可选的Whisper服务器Bearer认证

Whisper流式传输模式

Whisper模式在浏览器中记录原始PCM，将其转换为16 kHz单声道WAV，并通过内置的HTTPS代理进行流式传输，因此本地whisper-server可以处理与OpenAI兼容的请求。
默认情况下，我们代理到标准的whisper-server端点http://localhost:12017/v1/audio/transcriptions；如果你在其他主机或端口运行，可以将MCP_VOICE_WHISPER_URL指向你自己的地址。
当转录正在进行时，用户界面会继续录制，并忽略Whisper的非语音标签（例如[BLANK_AUDIO]、(typing)），因此只有真实的语音会被排队。
要启用此模式：
1. 在本地运行你的Whisper服务器（例如pfrankov/whisper-server中的whisper-server）。
2. 设置上述环境变量（MCP_VOICE_STT_MODE=whisper和完整的MCP_VOICE_WHISPER_URL）。
3. 重启jarvis-mcp并在浏览器中强制刷新（清空缓存重新加载）以加载流式传输包。
4. 语音状态（voice_status()工具）现在会报告Whisper或浏览器语音识别是否处于活动状态。

端口

HTTPS：5114（麦克风访问必需）
HTTP：5113（仅本地访问）

系统要求

Node.js 18+
Google Chrome（目前仅测试过此浏览器）
麦克风访问权限
可选：本地Whisper服务器（如pfrankov/whisper-server），如果你想通过MCP_VOICE_STT_MODE=whisper实现流式语音识别。

故障排除

移动设备出现证书警告？ 点击“高级” → “继续访问该网站”以接受自签名证书。
麦克风无法工作？ 确保使用的是HTTPS（而非HTTP），检查浏览器权限，尝试刷新页面。
人工智能不响应语音？ 确保正在使用converse工具（而非仅使用speak），检查超时设置是否正确。

开发

npm install
npm run build
npm run dev     # 监听模式
npm run start   # 运行服务器

📄 许可证

本项目采用MIT许可证。

jarvis-mcp

README

🚀 Jarvis MCP

✨ 主要特性

📦 安装指南

🚀 一键式安装

🤖 为何安装OpenCode插件？

📦 手动安装

💻 使用示例

基础用法

语音命令在人工智能聊天中的使用

📚 详细文档

浏览器界面

远程访问

配置

环境变量

Whisper流式传输模式

端口

系统要求

故障排除

开发

📄 许可证

运行方式说明

托管运行

本地运行 / 其它方式