返回 MCP 目录
public公开dns本地运行

Web Content Pick

一个用于从网页提取结构化内容的强大工具,支持自定义选择器和爬取选项

article

README

🚀 @modelcontextprotocol/web-content-pick

这是一款功能强大的工具,专门用于从网页中提取结构化内容。它支持自定义选择器和爬取选项,是模型上下文协议工具包的重要组成部分。

🚀 快速开始

安装

使用 npm 全局安装该工具:

npm install -g mcp-web-content-pick

配置

claude_desktop_config.json 中添加如下配置:

{
  "mcpServers": {
    "web_content_search": {
      "command": "npx",
      "args": [
        "-y",
        "mcp-web-content-pick"
      ]
    }
  }
}

✨ 主要特性

  • 🌐 可从任何网页提取结构化内容。
  • 🎯 支持使用自定义 CSS 选择器精准定位内容。
  • 🌲 具备带深度控制的递归爬取功能。
  • 🔄 拥有自动重试机制,确保数据提取的稳定性。
  • ⚡ 处理流程快速高效。
  • 📝 输出格式清晰,呈层次化结构。

💻 使用示例

基础用法

以下是使用该工具的示例,通过配置文件完成安装和配置后,即可开始从网页提取内容:

# 安装
npm install -g mcp-web-content-pick
# 配置文件示例
{
  "mcpServers": {
    "web_content_search": {
      "command": "npx",
      "args": [
        "-y",
        "mcp-web-content-pick"
      ]
    }
  }
}

效果展示

示意图

help

运行方式说明

cloud

托管运行

托管运行通常表示这个 MCP Server 由服务方环境承载,用户一般按页面提供的连接方式或授权流程接入,不需要在本地长期启动一个 MCP 进程

  1. 打开服务方连接页
  2. 完成授权或复制端点
  3. 在 MCP 客户端中连接
terminal

本地运行 / 其它方式

本地运行通常需要用户在自己的电脑或服务器上安装依赖,把 server_config 复制到 MCP 客户端,并按 env_schema 补齐环境变量、密钥或其它配置

  1. 复制 server_config
  2. 安装所需依赖
  3. 补齐环境变量后重启客户端