返回 MCP 目录
public公开dns本地运行

hub-semantic-search-mcp

一个非官方的Hugging Face Hub语义搜索MCP服务器,为Claude等MCP兼容客户端提供基于自然语言查询的模型和数据集搜索功能。

article

README

🚀 Hugging Face Hub语义搜索MCP服务器

本项目是一个MCP(模型上下文协议)服务器,为Hugging Face的模型和数据集提供语义搜索功能。借助该服务器,Claude及其他支持MCP的客户端能够使用自然语言查询,在Hugging Face生态系统中进行搜索、发现和探索。

⚠️ 重要提示

这是一个受Hugging Face官方MCP服务器启发而创建的非官方MCP服务器。如果官方推出了替代功能,该服务器可能随时被弃用。如需使用官方服务器,请访问 hf.co/mcp

✨ 主要特性

  • 语义搜索:由人工智能驱动的相似度搜索(不仅仅是关键词匹配)
  • 数据集搜索:根据自然语言描述查找数据集
  • 模型搜索:可选择按参数数量筛选查找模型
  • 相似度搜索:查找与给定模型/数据集相似的内容
  • 热门内容:获取当前热门的模型和数据集
  • 详细元数据:通过Hugging Face API访问全面的技术信息
  • 模型/数据集卡片:下载README卡片以获取详细信息

🛠️ 可用工具

数据集工具

  • search_datasets:使用自然语言查询搜索数据集
  • find_similar_datasets:查找与指定数据集相似的数据集
  • get_trending_datasets:获取当前热门的数据集
  • get_dataset_info:获取特定数据集的详细元数据
  • download_dataset_card:下载数据集的README卡片

模型工具

  • search_models:使用自然语言查询并可按参数筛选搜索模型
  • find_similar_models:查找与指定模型相似的模型
  • get_trending_models:获取当前热门的模型,并可按参数筛选
  • get_model_info:获取特定模型的详细元数据
  • get_model_safetensors_metadata:从safetensors中获取模型架构细节和参数数量
  • download_model_card:下载模型的README卡片

📦 安装指南

前提条件

  • UV - 快速Python包安装器
  • Claude Desktop或其他支持MCP的客户端

快速开始

无需安装!UV将自动获取并运行服务器。

⚙️ 配置

Claude Desktop设置

将以下内容添加到Claude Desktop配置文件中:

macOS~/Library/Application Support/Claude/claude_desktop_config.json
Windows%APPDATA%/Claude/claude_desktop_config.json

{
  "mcpServers": {
    "huggingface-hub-search": {
      "command": "uvx",
      "args": [
        "git+https://github.com/davanstrien/hub-semantic-search-mcp.git"
      ],
      "env": {
        "HF_SEARCH_API_URL": "https://davanstrien-huggingface-datasets-search-v2.hf.space"
      }
    }
  }
}

替代方案:本地开发设置

如果您想贡献代码或修改代码:

# 克隆仓库
git clone https://github.com/davanstrien/hub-semantic-search-mcp.git
cd hub-semantic-search-mcp

# 使用UV安装依赖项
uv sync

然后配置Claude Desktop以使用本地版本:

{
  "mcpServers": {
    "huggingface-hub-search": {
      "command": "uv",
      "args": [
        "--directory",
        "/path/to/hub-semantic-search-mcp",
        "run",
        "python",
        "app.py"
      ],
      "env": {
        "HF_SEARCH_API_URL": "https://davanstrien-huggingface-datasets-search-v2.hf.space"
      }
    }
  }
}

💻 使用示例

配置完成后,您可以在Claude Desktop中使用这些工具:

搜索数据集

"查找关于气候变化和天气模式的数据集"

搜索模型

"查找参数少于10亿的小型语言模型,用于文本生成"

查找相似内容

"查找与问答数据集 'squad' 相似的数据集"

获取热门内容

"显示本周排名前十的热门AI模型"

获取详细元数据

"获取 'stanford-nlp/imdb' 数据集的详细信息" "显示 'microsoft/DialoGPT-medium' 的技术细节和配置" " 'microsoft/DialoGPT-medium' 的参数数量和架构是什么?"

下载文档

"下载 'microsoft/DialoGPT-medium' 的模型卡片"

🌐 环境变量

  • HF_SEARCH_API_URL:搜索API的基础URL(默认:https://davanstrien-huggingface-datasets-search-v2.hf.space)

🔍 搜索后端

此MCP服务器连接到一个语义搜索API,该API使用人工智能生成的摘要对Hugging Face的模型和数据集进行索引。搜索使用基于嵌入的相似度,而不是关键词匹配,因此在根据意图和含义发现相关内容方面更加有效。

🛠️ 开发

本地运行

# 直接运行服务器
uv run python app.py

# 或者激活虚拟环境
uv shell
python app.py

使用MCP Inspector进行测试

# 测试GitHub版本
npx @modelcontextprotocol/inspector uvx git+https://github.com/davanstrien/hub-semantic-search-mcp.git

# 或者进行本地测试
npx @modelcontextprotocol/inspector uv run python app.py

🤝 贡献代码

欢迎贡献代码!请随时提交问题和拉取请求。

开发设置

git clone https://github.com/davanstrien/hub-semantic-search-mcp.git
cd hub-semantic-search-mcp
uv sync --dev

📄 许可证

本项目采用MIT许可证,详情请参阅LICENSE文件。

🔗 相关项目

help

运行方式说明

cloud

托管运行

托管运行通常表示这个 MCP Server 由服务方环境承载,用户一般按页面提供的连接方式或授权流程接入,不需要在本地长期启动一个 MCP 进程

  1. 打开服务方连接页
  2. 完成授权或复制端点
  3. 在 MCP 客户端中连接
terminal

本地运行 / 其它方式

本地运行通常需要用户在自己的电脑或服务器上安装依赖,把 server_config 复制到 MCP 客户端,并按 env_schema 补齐环境变量、密钥或其它配置

  1. 复制 server_config
  2. 安装所需依赖
  3. 补齐环境变量后重启客户端