Back to MCP directory
publicPublicdnsLocal runtime

scrapi-mcp-server

Scrapi AI的MCP服务器可将网页URL转换为干净的Markdown/文本格式,供AI代理读取和分析网页内容,支持JavaScript渲染和批量处理。

article

README

文章标题

作者:John Doe | 发布时间:2024-01-15

引言

这是文章的主要内容,已转换为简洁的Markdown格式...

要点

  • 要点1:重要细节
  • 要点2:另一个见解
  • 相关链接

**文本输出**:
```text
文章标题

作者:John Doe | 发布时间:2024-01-15

引言

这是文章的主要内容,已转换为纯文本格式...

要点

- 要点1:重要细节
- 要点2:另一个见解

scrape_urls

并行抓取多个网页并返回AI可读的内容。 参数: | 名称 | 类型 | 是否必需 | 描述 | | -------- | -------- | -------- | ---------------------------------------- | | urls | 字符串数组 | ✅ | 要抓取的URL列表(最多10个) | | format | 字符串 | | markdown(默认)或text |

示例

{
  "urls": ["https://example.com/page1", "https://example.com/page2"],
  "format": "text"
}

输出

[
  {
    "url": "https://example.com/page1",
    "content": "页面1标题\n\n这是页面1的内容..."
  },
  {
    "url": "https://example.com/page2",
    "content": "页面2标题\n\n这是页面2的内容..."
  }
]

scraper_server_status

检查所有ScraperServer实例的状态,显示服务器健康状况、断路器状态、失败次数和时间信息。 参数:无

示例

{}

输出

## ScraperServer状态

总数:3 | 可用:2

| 名称 | 操作系统 | 状态 | 失败次数 | 上次成功时间 | 上次失败时间 |
|------|----|--------|----------|--------------|--------------|
| pluto | linux | OK | 0 | 01/30 14:23:05 | - |
| mars | mac | FAIL | 2 | 01/29 10:00:00 | 01/30 13:55:12 |
| venus | linux | OPEN | 3 | 01/28 09:00:00 | 01/30 12:00:00 |

### 问题
- **mars**:连接被拒绝 - connect(2)
- **venus**:断路器打开,直到01/30 12:30:00
- **venus**:Net::ReadTimeout

状态值: | 状态 | 描述 | |--------|-------------| | OK | 服务器正常 | | FAIL | 服务器异常 | | OPEN | 断路器打开(隔离30分钟) | | N/A | 尚未检查 |

get_usage

检查API使用情况和剩余积分。 参数:无

示例

{}

输出

## MCP积分

| 项目 | 值 |
|------|-------|
| 计划 | starter |
| 订阅积分 | 1,500 |
| 购买积分 | 200 |
| 总剩余积分 | 1,700 |
| 周期结束时间 | 2026-03-01 |

get_billing

获取详细的计费信息,包括订阅、计划、每日使用情况和消费限制。 参数: | 名称 | 类型 | 是否必需 | 描述 | |------|------|----------|-------------| | action | 字符串 | 是 | subscriptionplansdaily_usagespending_limits | | start_date | 字符串 | | daily_usage的开始日期(YYYY-MM-DD,默认:30天前) | | end_date | 字符串 | | daily_usage的结束日期(YYYY-MM-DD,默认:今天) |

示例 — 当前订阅

{ "action": "subscription" }
## MCP订阅

| 项目 | 值 |
|------|-------|
| 计划 | starter (Starter) |
| 状态 | active |
| 每月积分 | 2,000 |
| 价格 | $19.00/月 |
| 速率限制 | 30 RPM |
| 突发限制 | 5并发 |
| 周期结束时间 | 2026-03-01 |

示例 — 可用计划

{ "action": "plans" }
## 可用的MCP计划

| 计划 | 每月积分 | 价格 | RPM | 突发限制 |
|------|-----------|-------|-----|-------|
| Free (free) | 500 | 免费 | 10 | 2 |
| Starter (starter) | 2,000 | $19.00/月 | 30 | 5 |
| Pro (pro) | 10,000 | $49.00/月 | 60 | 10 |
| Business (business) | 50,000 | $149.00/月 | 120 | 20 |

示例 — 每日使用历史

{ "action": "daily_usage", "start_date": "2026-02-01", "end_date": "2026-02-07" }
## 每日使用情况(2026-02-01 ~ 2026-02-07)

| 日期 | 请求次数 | 积分 | 主要工具 |
|------|----------|---------|----------|
| 2026-02-07 | 45 | 45 | scrape#scrape (45) |
| 2026-02-06 | 120 | 120 | scrape#scrape (100) |

**总计**:165次请求,165积分

示例 — 消费限制

{ "action": "spending_limits" }
## 消费限制

| 项目 | 值 |
|------|-------|
| 每日限制 | 500积分 |
| 今日使用 | 120积分 |
| 使用百分比 | 24.0% |

🔧 技术细节

工作原理

┌─────────────────┐
│     用户        │
│ "为我总结这个 │
│   URL的内容"   │
└────────┬────────┘
         │
         ▼
┌─────────────────┐
│  Claude Desktop │
│    / Cursor     │
└────────┬────────┘
         │
         ▼
┌─────────────────┐     ┌─────────────────┐
│   MCP服务器    │────►│   Scrapi API    │
│  (scrape_url)   │     │ (format参数)  │
└────────┬────────┘     └────────┬────────┘
         │                       │
         │◄──────────────────────┘
         │   Markdown/文本响应
         ▼
┌─────────────────┐
│   AI响应        │
│ (总结等内容)    │
└─────────────────┘

选择Scrapi的原因

Scrapi团队打造,拥有8年以上的网页抓取经验:

  • ✅ 1900多个生产爬虫。
  • ✅ 支持JavaScript渲染。
  • ✅ 具备反爬虫处理能力。
  • ✅ 99.9%的正常运行时间。

📄 许可证

本项目采用MIT许可证,版权归Scrapi所有。

常见问题解答

"需要API密钥"

确保通过以下方法提供API密钥:

  • 环境变量:在配置中设置SCRAPI_API_KEY
  • 命令行参数:在参数中传递--api-key your-key

"无效的API密钥"

验证你的API密钥是否正确,并在Scrapi仪表盘上处于激活状态。

npx使用旧的缓存版本

如果你升级后仍看到旧的行为,请清除npx缓存:

npx clear-npx-cache
help

Runtime guide

cloud

Hosted runtime

Hosted servers run from a provider-managed environment. You usually connect the MCP client to the hosted endpoint or follow the provider's authorization flow, without keeping a local process alive

  1. Open provider connection page
  2. Authorize or copy endpoint
  3. Connect from your MCP client
terminal

Local runtime / other methods

Local servers run on your own machine or infrastructure. You normally copy the server_config into your MCP client, install the required package, and provide env variables from env_schema when needed

  1. Copy server_config
  2. Install required package
  3. Fill env variables and restart client