README
文章标题
作者:John Doe | 发布时间:2024-01-15
引言
这是文章的主要内容,已转换为简洁的Markdown格式...
要点
- 要点1:重要细节
- 要点2:另一个见解
- 相关链接
**文本输出**:
```text
文章标题
作者:John Doe | 发布时间:2024-01-15
引言
这是文章的主要内容,已转换为纯文本格式...
要点
- 要点1:重要细节
- 要点2:另一个见解
scrape_urls
并行抓取多个网页并返回AI可读的内容。
参数:
| 名称 | 类型 | 是否必需 | 描述 |
| -------- | -------- | -------- | ---------------------------------------- |
| urls | 字符串数组 | ✅ | 要抓取的URL列表(最多10个) |
| format | 字符串 | | markdown(默认)或text |
示例:
{
"urls": ["https://example.com/page1", "https://example.com/page2"],
"format": "text"
}
输出:
[
{
"url": "https://example.com/page1",
"content": "页面1标题\n\n这是页面1的内容..."
},
{
"url": "https://example.com/page2",
"content": "页面2标题\n\n这是页面2的内容..."
}
]
scraper_server_status
检查所有ScraperServer实例的状态,显示服务器健康状况、断路器状态、失败次数和时间信息。 参数:无
示例:
{}
输出:
## ScraperServer状态
总数:3 | 可用:2
| 名称 | 操作系统 | 状态 | 失败次数 | 上次成功时间 | 上次失败时间 |
|------|----|--------|----------|--------------|--------------|
| pluto | linux | OK | 0 | 01/30 14:23:05 | - |
| mars | mac | FAIL | 2 | 01/29 10:00:00 | 01/30 13:55:12 |
| venus | linux | OPEN | 3 | 01/28 09:00:00 | 01/30 12:00:00 |
### 问题
- **mars**:连接被拒绝 - connect(2)
- **venus**:断路器打开,直到01/30 12:30:00
- **venus**:Net::ReadTimeout
状态值:
| 状态 | 描述 |
|--------|-------------|
| OK | 服务器正常 |
| FAIL | 服务器异常 |
| OPEN | 断路器打开(隔离30分钟) |
| N/A | 尚未检查 |
get_usage
检查API使用情况和剩余积分。 参数:无
示例:
{}
输出:
## MCP积分
| 项目 | 值 |
|------|-------|
| 计划 | starter |
| 订阅积分 | 1,500 |
| 购买积分 | 200 |
| 总剩余积分 | 1,700 |
| 周期结束时间 | 2026-03-01 |
get_billing
获取详细的计费信息,包括订阅、计划、每日使用情况和消费限制。
参数:
| 名称 | 类型 | 是否必需 | 描述 |
|------|------|----------|-------------|
| action | 字符串 | 是 | subscription、plans、daily_usage或spending_limits |
| start_date | 字符串 | | daily_usage的开始日期(YYYY-MM-DD,默认:30天前) |
| end_date | 字符串 | | daily_usage的结束日期(YYYY-MM-DD,默认:今天) |
示例 — 当前订阅:
{ "action": "subscription" }
## MCP订阅
| 项目 | 值 |
|------|-------|
| 计划 | starter (Starter) |
| 状态 | active |
| 每月积分 | 2,000 |
| 价格 | $19.00/月 |
| 速率限制 | 30 RPM |
| 突发限制 | 5并发 |
| 周期结束时间 | 2026-03-01 |
示例 — 可用计划:
{ "action": "plans" }
## 可用的MCP计划
| 计划 | 每月积分 | 价格 | RPM | 突发限制 |
|------|-----------|-------|-----|-------|
| Free (free) | 500 | 免费 | 10 | 2 |
| Starter (starter) | 2,000 | $19.00/月 | 30 | 5 |
| Pro (pro) | 10,000 | $49.00/月 | 60 | 10 |
| Business (business) | 50,000 | $149.00/月 | 120 | 20 |
示例 — 每日使用历史:
{ "action": "daily_usage", "start_date": "2026-02-01", "end_date": "2026-02-07" }
## 每日使用情况(2026-02-01 ~ 2026-02-07)
| 日期 | 请求次数 | 积分 | 主要工具 |
|------|----------|---------|----------|
| 2026-02-07 | 45 | 45 | scrape#scrape (45) |
| 2026-02-06 | 120 | 120 | scrape#scrape (100) |
**总计**:165次请求,165积分
示例 — 消费限制:
{ "action": "spending_limits" }
## 消费限制
| 项目 | 值 |
|------|-------|
| 每日限制 | 500积分 |
| 今日使用 | 120积分 |
| 使用百分比 | 24.0% |
🔧 技术细节
工作原理
┌─────────────────┐
│ 用户 │
│ "为我总结这个 │
│ URL的内容" │
└────────┬────────┘
│
▼
┌─────────────────┐
│ Claude Desktop │
│ / Cursor │
└────────┬────────┘
│
▼
┌─────────────────┐ ┌─────────────────┐
│ MCP服务器 │────►│ Scrapi API │
│ (scrape_url) │ │ (format参数) │
└────────┬────────┘ └────────┬────────┘
│ │
│◄──────────────────────┘
│ Markdown/文本响应
▼
┌─────────────────┐
│ AI响应 │
│ (总结等内容) │
└─────────────────┘
选择Scrapi的原因
由Scrapi团队打造,拥有8年以上的网页抓取经验:
- ✅ 1900多个生产爬虫。
- ✅ 支持JavaScript渲染。
- ✅ 具备反爬虫处理能力。
- ✅ 99.9%的正常运行时间。
📄 许可证
本项目采用MIT许可证,版权归Scrapi所有。
常见问题解答
"需要API密钥"
确保通过以下方法提供API密钥:
- 环境变量:在配置中设置
SCRAPI_API_KEY。 - 命令行参数:在参数中传递
--api-key your-key。
"无效的API密钥"
验证你的API密钥是否正确,并在Scrapi仪表盘上处于激活状态。
npx使用旧的缓存版本
如果你升级后仍看到旧的行为,请清除npx缓存:
npx clear-npx-cache
微信扫一扫