article

README

文章标题

作者：John Doe | 发布时间：2024-01-15

引言

这是文章的主要内容，已转换为简洁的Markdown格式...

要点

要点1：重要细节
要点2：另一个见解
相关链接


**文本输出**：
```text
文章标题

作者：John Doe | 发布时间：2024-01-15

引言

这是文章的主要内容，已转换为纯文本格式...

要点

- 要点1：重要细节
- 要点2：另一个见解

`scrape_urls`

并行抓取多个网页并返回AI可读的内容。参数： | 名称 | 类型 | 是否必需 | 描述 | | -------- | -------- | -------- | ---------------------------------------- | | urls | 字符串数组 | ✅ | 要抓取的URL列表（最多10个） | | format | 字符串 | | markdown（默认）或text |

示例：

{
  "urls": ["https://example.com/page1", "https://example.com/page2"],
  "format": "text"
}

输出：

[
  {
    "url": "https://example.com/page1",
    "content": "页面1标题\n\n这是页面1的内容..."
  },
  {
    "url": "https://example.com/page2",
    "content": "页面2标题\n\n这是页面2的内容..."
  }
]

`scraper_server_status`

检查所有ScraperServer实例的状态，显示服务器健康状况、断路器状态、失败次数和时间信息。参数：无

示例：

{}

输出：

## ScraperServer状态

总数：3 | 可用：2

| 名称 | 操作系统 | 状态 | 失败次数 | 上次成功时间 | 上次失败时间 |
|------|----|--------|----------|--------------|--------------|
| pluto | linux | OK | 0 | 01/30 14:23:05 | - |
| mars | mac | FAIL | 2 | 01/29 10:00:00 | 01/30 13:55:12 |
| venus | linux | OPEN | 3 | 01/28 09:00:00 | 01/30 12:00:00 |

### 问题
- **mars**：连接被拒绝 - connect(2)
- **venus**：断路器打开，直到01/30 12:30:00
- **venus**：Net::ReadTimeout

状态值： | 状态 | 描述 | |--------|-------------| | OK | 服务器正常 | | FAIL | 服务器异常 | | OPEN | 断路器打开（隔离30分钟） | | N/A | 尚未检查 |

`get_usage`

检查API使用情况和剩余积分。参数：无

示例：

{}

输出：

## MCP积分

| 项目 | 值 |
|------|-------|
| 计划 | starter |
| 订阅积分 | 1,500 |
| 购买积分 | 200 |
| 总剩余积分 | 1,700 |
| 周期结束时间 | 2026-03-01 |

`get_billing`

获取详细的计费信息，包括订阅、计划、每日使用情况和消费限制。参数： | 名称 | 类型 | 是否必需 | 描述 | |------|------|----------|-------------| | action | 字符串 | 是 | subscription、plans、daily_usage或spending_limits | | start_date | 字符串 | | daily_usage的开始日期（YYYY-MM-DD，默认：30天前） | | end_date | 字符串 | | daily_usage的结束日期（YYYY-MM-DD，默认：今天） |

示例 — 当前订阅：

{ "action": "subscription" }

## MCP订阅

| 项目 | 值 |
|------|-------|
| 计划 | starter (Starter) |
| 状态 | active |
| 每月积分 | 2,000 |
| 价格 | $19.00/月 |
| 速率限制 | 30 RPM |
| 突发限制 | 5并发 |
| 周期结束时间 | 2026-03-01 |

示例 — 可用计划：

{ "action": "plans" }

## 可用的MCP计划

| 计划 | 每月积分 | 价格 | RPM | 突发限制 |
|------|-----------|-------|-----|-------|
| Free (free) | 500 | 免费 | 10 | 2 |
| Starter (starter) | 2,000 | $19.00/月 | 30 | 5 |
| Pro (pro) | 10,000 | $49.00/月 | 60 | 10 |
| Business (business) | 50,000 | $149.00/月 | 120 | 20 |

示例 — 每日使用历史：

{ "action": "daily_usage", "start_date": "2026-02-01", "end_date": "2026-02-07" }

## 每日使用情况（2026-02-01 ~ 2026-02-07）

| 日期 | 请求次数 | 积分 | 主要工具 |
|------|----------|---------|----------|
| 2026-02-07 | 45 | 45 | scrape#scrape (45) |
| 2026-02-06 | 120 | 120 | scrape#scrape (100) |

**总计**：165次请求，165积分

示例 — 消费限制：

{ "action": "spending_limits" }

## 消费限制

| 项目 | 值 |
|------|-------|
| 每日限制 | 500积分 |
| 今日使用 | 120积分 |
| 使用百分比 | 24.0% |

🔧 技术细节

工作原理

┌─────────────────┐
│     用户        │
│ "为我总结这个 │
│   URL的内容"   │
└────────┬────────┘
         │
         ▼
┌─────────────────┐
│  Claude Desktop │
│    / Cursor     │
└────────┬────────┘
         │
         ▼
┌─────────────────┐     ┌─────────────────┐
│   MCP服务器    │────►│   Scrapi API    │
│  (scrape_url)   │     │ (format参数)  │
└────────┬────────┘     └────────┬────────┘
         │                       │
         │◄──────────────────────┘
         │   Markdown/文本响应
         ▼
┌─────────────────┐
│   AI响应        │
│ (总结等内容)    │
└─────────────────┘

选择Scrapi的原因

由Scrapi团队打造，拥有8年以上的网页抓取经验：

✅ 1900多个生产爬虫。
✅ 支持JavaScript渲染。
✅ 具备反爬虫处理能力。
✅ 99.9%的正常运行时间。

📄 许可证

本项目采用MIT许可证，版权归Scrapi所有。

常见问题解答

"需要API密钥"

确保通过以下方法提供API密钥：

环境变量：在配置中设置SCRAPI_API_KEY。
命令行参数：在参数中传递--api-key your-key。

"无效的API密钥"

验证你的API密钥是否正确，并在Scrapi仪表盘上处于激活状态。

npx使用旧的缓存版本

如果你升级后仍看到旧的行为，请清除npx缓存：

npx clear-npx-cache

scrapi-mcp-server