article
README
🚀 多模态模型上下文协议服务器
本仓库涵盖了一组Pixeltable服务器的实现,主要用于处理多模态数据(包括音频、视频、图像和文档)的索引与查询。这些服务借助Docker进行本地开发环境的编排。
🚀 快速开始
本项目提供了一系列用于处理多模态数据的服务器,以下是各服务器的详细介绍:
音频索引服务器
- 位置:
servers/audio-index/ - 功能:
- 具备音频文件索引与转录能力。
- 支持音频内容的语义搜索。
- 可处理多索引的音频集合。
- 通过
/audio端点进行访问。
视频索引服务器
- 位置:
servers/video-index/ - 功能:
- 能够对视频文件进行索引并提取帧。
- 支持基于内容的视频搜索。
- 通过
/video端点进行访问。
图像索引服务器
- 位置:
servers/image-index/ - 功能:
- 可对图像进行索引并进行目标检测。
- 支持图像相似性搜索。
- 通过
/image端点进行访问。
文档索引服务器
- 位置:
servers/doc-index/ - 功能:
- 能够对文档进行索引并提取文本。
- 提供增强检索(RAG)支持。
- 通过
/doc端点进行访问。
基础SDK服务器
- 位置:
servers/base-sdk/ - 功能:
- 包含Pixeltable集成的核心功能。
- 是构建专用服务器的基础模块。
📦 安装指南
本地开发环境
pip install pixeltable
git clone https://github.com/pixeltable/mcp-server-pixeltable.git
cd mcp-server-pixeltable/servers
docker-compose up --build # 使用 docker-compose 本地运行
docker-compose down # 释放资源
🔧 技术细节
- 端口配置:每个服务在其指定端口上运行,具体为音频服务端口8080,视频服务端口8081,图像服务端口8082,文档服务端口8083。
- 服务设置:可在相应的Dockerfile中或通过环境变量对服务设置进行配置。
🔗 相关链接
📞 支持与帮助
📄 许可证
本项目采用Apache 2.0许可证。
Scan to join WeChat group