README
🚀 PRIDE 档案 MCP 搜索服务器
该项目实现了一个符合 模型上下文协议 (MCP) 的 API 服务器,为搜索 PRIDE Archive(一个主要的蛋白质组学数据仓库)提供了工具。它允许 AI 模型(例如 Claude 或其他与 MCP 兼容的大语言模型)通过结构化的函数调用,以编程方式与蛋白质组学数据集进行交互。
🚀 快速开始
本项目实现的 API 服务器,能助力 AI 模型与蛋白质组学数据集交互,为生物医学和蛋白质组学研究提供便利。
✨ 主要特性
- ✅ 由
FastMCP驱动的 MCP 服务器,性能出色。 - 🔍 PRIDE 档案搜索工具,可依据关键字、提交日期、流行度等条件查询数据集。
- 🤖 对生物医学和蛋白质组学研究友好的 AI 工具,降低研究门槛。
- ⚡ 支持
http(SSE)和stdio连接模式,满足不同使用场景。 - 🛠️ 可通过添加更多工具轻松扩展,具备良好的扩展性。
📦 安装指南
克隆仓库并安装依赖项:
git clone https://github.com/PRIDE-Archive/mcp_pride_archive_search.git
cd mcp_pride_archive_search
poetry install # 或 pip install -r requirements.txt
💻 使用示例
基础用法
使用您首选的连接类型(http 或 stdio)启动 MCP 服务器:
python -m mcp_pride_archive_search --connection_type http --port 9999
命令行参数: | 参数 | 描述 | 默认值 | | ---- | ---- | ---- | | --connection_type | 连接类型:http 或 stdio | http | | --port | 服务器运行的端口(用于 HTTP 模式) | 9999 |
🔧 技术细节
search_archive_tool(...)
从 PRIDE 档案数据库获取蛋白质组学数据集。
适用场景:
- 搜索蛋白质组学研究数据。
- 质谱数据集查询。
- 生物医学数据集探索(例如癌症相关)。
- 查找流行或特定的蛋白质组学项目。
🤝 与 LLM 的集成
此服务器适用于任何支持模型上下文协议的 LLM,包括:
- Anthropic Claude
- Google Gemini
- 开源 MCP 客户端
- 自定义 RAG 管道
🧠 架构概述
+---------------------+ 工具调用 +-----------------------------+
| Claude / Gemini AI | <--------------------> | MCP PRIDE API 服务器 |
+---------------------+ | - search_archive_tool() |
| - server_status() |
+-----------------------------+
|
v
+---------------------------+
| PRIDE 档案 REST API |
| (https://www.ebi.ac.uk |
| /pride/ws/archive/ |
| v3/search/projects) |
+---------------------------+
Scan to join WeChat group