article
README
🚀 Podcast爬虫MCP服务器
一个用于通过网络爬取发现播客的MCP(模型上下文协议)服务器。PodCrawlerMCP允许AI助手通过爬取网络上的RSS feed来查找特定主题的播客,为用户提供便捷的播客搜索体验。
🚀 快速开始
直接运行服务器
python -m podcrawler.server
在Python代码中使用
from podcrawler import PodCrawlerServer
server = PodCrawlerServer()
server.run()
✨ 主要特性
- 🕸️ 爬取播客目录以发现RSS feed
- 🎙️ 解析RSS feed以提取节目信息
- 🔍 根据主题或领域过滤节目
- 🔌 通过MCP工具暴露功能
- 🤖 与Claude等AI助手无缝集成
📦 安装指南
使用pip安装
pip install podcrawler-mcp
使用Poetry安装
poetry add podcrawler-mcp
💻 使用示例
基础用法
直接运行服务器
python -m podcrawler.server
在Python代码中使用
from podcrawler import PodCrawlerServer
server = PodCrawlerServer()
server.run()
高级用法
与Claude Desktop集成
将以下内容添加到Claude Desktop配置中:
{
"mcpServers": {
"podcrawler": {
"command": "python",
"args": ["-m", "podcrawler.server"]
}
}
}
工具使用示例
discover_podcasts
按主题发现播客。
参数:
topic(字符串):要搜索的主题(例如,“技术”,“历史”)max_results(整数,可选):要返回的最大结果数(默认值:10)
示例用法:有哪些关于黑洞的科学播客?
📚 详细文档
项目结构
podcrawler-mcp/
├── podcrawler/ # 主包
│ ├── __init__.py # 包初始化
│ ├── server.py # MCP服务器实现
│ ├── tools/ # MCP工具
│ │ ├── __init__.py
│ │ └── discovery.py # 播客发现工具
│ ├── crawler/ # 网络爬取组件
│ │ ├── __init__.py
│ │ ├── spider.py # 网络爬虫实现
│ │ └── parser.py # RSS feed解析器
│ └── utils/ # 工具函数
│ ├── __init__.py
│ ├── filtering.py # 主题过滤实用工具
│ └── formatting.py # 输出格式化实用工具
├── tests/ # 测试
│ ├── __init__.py
│ └── test_server.py # 服务器测试
├── examples/ # 使用示例
│ └── basic_discovery.py # 基本发现示例
├── pyproject.toml # 项目配置
├── README.md # 项目文档
├── LICENSE # MIT许可证
└── CONTRIBUTING.md # 贡献指南
开发步骤
- 克隆仓库
git clone https://github.com/infinitimeless/podcrawler-mcp.git
cd podcrawler-mcp
- 使用Poetry安装依赖项
poetry install
- 运行测试
poetry run pytest
📄 许可证
该项目根据MIT许可证发布。有关详细信息,请参阅LICENSE文件。
贡献
欢迎贡献!请参阅CONTRIBUTING.md了解详细信息。
Scan to join WeChat group