README
🚀 Hugging Face Hub语义搜索MCP服务器
本项目是一个MCP(模型上下文协议)服务器,为Hugging Face的模型和数据集提供语义搜索功能。借助该服务器,Claude及其他支持MCP的客户端能够使用自然语言查询,在Hugging Face生态系统中进行搜索、发现和探索。
⚠️ 重要提示
这是一个受Hugging Face官方MCP服务器启发而创建的非官方MCP服务器。如果官方推出了替代功能,该服务器可能随时被弃用。如需使用官方服务器,请访问 hf.co/mcp。
✨ 主要特性
- 语义搜索:由人工智能驱动的相似度搜索(不仅仅是关键词匹配)
- 数据集搜索:根据自然语言描述查找数据集
- 模型搜索:可选择按参数数量筛选查找模型
- 相似度搜索:查找与给定模型/数据集相似的内容
- 热门内容:获取当前热门的模型和数据集
- 详细元数据:通过Hugging Face API访问全面的技术信息
- 模型/数据集卡片:下载README卡片以获取详细信息
🛠️ 可用工具
数据集工具
search_datasets:使用自然语言查询搜索数据集find_similar_datasets:查找与指定数据集相似的数据集get_trending_datasets:获取当前热门的数据集get_dataset_info:获取特定数据集的详细元数据download_dataset_card:下载数据集的README卡片
模型工具
search_models:使用自然语言查询并可按参数筛选搜索模型find_similar_models:查找与指定模型相似的模型get_trending_models:获取当前热门的模型,并可按参数筛选get_model_info:获取特定模型的详细元数据get_model_safetensors_metadata:从safetensors中获取模型架构细节和参数数量download_model_card:下载模型的README卡片
📦 安装指南
前提条件
- UV - 快速Python包安装器
- Claude Desktop或其他支持MCP的客户端
快速开始
无需安装!UV将自动获取并运行服务器。
⚙️ 配置
Claude Desktop设置
将以下内容添加到Claude Desktop配置文件中:
macOS:~/Library/Application Support/Claude/claude_desktop_config.json
Windows:%APPDATA%/Claude/claude_desktop_config.json
{
"mcpServers": {
"huggingface-hub-search": {
"command": "uvx",
"args": [
"git+https://github.com/davanstrien/hub-semantic-search-mcp.git"
],
"env": {
"HF_SEARCH_API_URL": "https://davanstrien-huggingface-datasets-search-v2.hf.space"
}
}
}
}
替代方案:本地开发设置
如果您想贡献代码或修改代码:
# 克隆仓库
git clone https://github.com/davanstrien/hub-semantic-search-mcp.git
cd hub-semantic-search-mcp
# 使用UV安装依赖项
uv sync
然后配置Claude Desktop以使用本地版本:
{
"mcpServers": {
"huggingface-hub-search": {
"command": "uv",
"args": [
"--directory",
"/path/to/hub-semantic-search-mcp",
"run",
"python",
"app.py"
],
"env": {
"HF_SEARCH_API_URL": "https://davanstrien-huggingface-datasets-search-v2.hf.space"
}
}
}
}
💻 使用示例
配置完成后,您可以在Claude Desktop中使用这些工具:
搜索数据集
"查找关于气候变化和天气模式的数据集"
搜索模型
"查找参数少于10亿的小型语言模型,用于文本生成"
查找相似内容
"查找与问答数据集 'squad' 相似的数据集"
获取热门内容
"显示本周排名前十的热门AI模型"
获取详细元数据
"获取 'stanford-nlp/imdb' 数据集的详细信息" "显示 'microsoft/DialoGPT-medium' 的技术细节和配置" " 'microsoft/DialoGPT-medium' 的参数数量和架构是什么?"
下载文档
"下载 'microsoft/DialoGPT-medium' 的模型卡片"
🌐 环境变量
HF_SEARCH_API_URL:搜索API的基础URL(默认:https://davanstrien-huggingface-datasets-search-v2.hf.space)
🔍 搜索后端
此MCP服务器连接到一个语义搜索API,该API使用人工智能生成的摘要对Hugging Face的模型和数据集进行索引。搜索使用基于嵌入的相似度,而不是关键词匹配,因此在根据意图和含义发现相关内容方面更加有效。
🛠️ 开发
本地运行
# 直接运行服务器
uv run python app.py
# 或者激活虚拟环境
uv shell
python app.py
使用MCP Inspector进行测试
# 测试GitHub版本
npx @modelcontextprotocol/inspector uvx git+https://github.com/davanstrien/hub-semantic-search-mcp.git
# 或者进行本地测试
npx @modelcontextprotocol/inspector uv run python app.py
🤝 贡献代码
欢迎贡献代码!请随时提交问题和拉取请求。
开发设置
git clone https://github.com/davanstrien/hub-semantic-search-mcp.git
cd hub-semantic-search-mcp
uv sync --dev
📄 许可证
本项目采用MIT许可证,详情请参阅LICENSE文件。
🔗 相关项目
- 模型上下文协议
- Hugging Face Hub
- Claude Desktop
- UV - 快速Python包安装器
Scan to join WeChat group