金大哥 - DuckDuckGo Search MCP 详情

article

README

🚀 MCP 鸭子🦆 插件

MCP 鸭子🦆 插件是一款强大的工具，可增强内容提取和网络爬取功能。它借助 DuckDuckGo 搜索进行内容抓取，还具备丰富的数据处理能力。

🚀 快速开始

你可以按照以下步骤快速使用 MCP 鸭子🦆 插件：

安装插件。
启动 MCP 服务器。
安装项目依赖。

具体操作请参考下面的安装指南和使用说明。

✨ 主要特性

增强内容提取

该插件提供了强大的内容分析和抓取功能：

网页分析：从 DuckDuckGo 搜索结果中提取并解析 HTML 内容。
智能内容识别：根据网站类型自动定位主要信息区域。
元数据提取：提取标题、描述、作者、关键词和发布日期等信息。
图片检测：识别网页中的主要图像和媒体资源。
社交链接提取：获取网页中嵌入的社交媒体链接。
内容结构分析：提取网页中的 headings 和 sections，帮助理解页面组织结构。
官方来源识别：通过域名和内容信号判断信息源是否为官方渠道。

网页爬取功能

插件还提供了基础的网络爬虫功能：

可配置深度：从原始 URL 开始，最多遍历 3 层链接。
链接限制：控制每页要抓取的最大链接数（1 - 5）。
域名限制：可选开启“仅在同一域名内抓取”选项。
相关内容发现：根据爬取结果分析和提取相关网页内容。

📦 安装指南

快速安装

pip install mcp-duckduckgo

克隆仓库（开发用途）

如果你需要对项目进行修改或贡献代码，可以先克隆仓库：

git clone https://github.com/gianlucamazza/mcp-duckduckgo.git
cd mcp-duckduckgo
pip install -e .

💻 使用示例

初始化 MCP 服务器

运行以下命令启动 MCP 服务器：

mcp-duckduckgo serve --port=8000

安装依赖

在项目根目录中，安装所有依赖项：

pip install -r requirements.txt

📚 详细文档

项目结构

项目包含以下主要文件：

mcp_duckduckgo/
├── mcp_duckduckgo/    # 插件主代码
│   ├── models.py       # 数据模型定义
│   ├── search.py       # 搜索功能实现
│   └── server.py       # MCP 服务器实现
└── scripts/            # 开发脚本
    ├── install_dev.sh  # 设置开发环境
    ├── run.sh          # 运行 MCP 服务器（开发模式）
    ├── test.sh         # 执行测试用例并生成覆盖率报告
    └── lint.sh         # 执行代码格式检查和修复

开发脚本

项目提供了一些便利的脚本，位于 scripts/ 目录中：

install_dev.sh：安装开发环境所需的依赖。
run.sh：使用开发模式运行 MCP 服务器。
test.sh：执行测试用例并生成覆盖率报告。
lint.sh：执行代码格式检查和修复。

测试指南

要在项目中执行测试，可以运行以下命令：

python -m pytest tests/ --cov=mcp_duckduckgo/

依赖管理

项目的依赖信息记录在 requirements.txt 文件中。安装所有依赖项：

pip install -r requirements.txt

贡献指南

欢迎任何贡献！请遵循以下步骤：

克隆仓库：git clone https://github.com/gianlucamazza/mcp-duckduckgo.git
创建功能分支：git checkout -b feature/your-feature-name
提交更改：git add . && git commit -m "添加新功能"
推送到远程仓库：git push origin feature/your-feature-name
提交 Pull Request 到主分支。

📄 许可证

项目使用 MIT 许可证，具体内容如下：

MIT License

感谢您对 MCP 鸭子🦆 插件的关注！如果有任何问题或建议，请随时联系我们。

DuckDuckGo Search