小红书爆款笔记采集器 (xhs-scraper)
一键采集小红书搜索结果中的爆款笔记数据。
搭配工具
Ai运营助手 — 手机端 + 电脑浏览器插件多端采集进飞书表格,是整条链路的起点;
OpenClaw 无缝接表做分析与 skills 编排,把表格里的数据真正用起来。
👉 https://sph.shucaigang.cn/web/aiAssistant/index
📦 安装步骤
第1步:克隆 / 下载本 Skill
将本 Skill 目录放入 OpenClaw 的 skills 目录:
~/.qclaw/skills/xhs-scraper\
第2步:安装依赖
cd <skill目录>\scripts
npm install
如果提示没有 npm,先去下载 Node.js:https://nodejs.org/ (下载 LTS 版本)
第3步:打开浏览器
在 QClaw 里直接告诉 Agent:
"帮我打开小红书搜索 xxx"
或者手动打开 Chrome(加调试端口):
- 找到 Chrome 快捷方式 → 右键 → 属性
- 在"目标"末尾加一个空格,然后粘贴:
--remote-debugging-port=9222 - 打开浏览器,登录小红书
第4步:运行采集
node <skill目录>/scripts/extract.js
或者直接告诉 QClaw Agent:
"运行小红书采集,关键词:电商"
⚙️ 如何修改采集条件
打开 <skill目录>/scripts/extract.js,找到 CONFIG 部分:
const CONFIG = {
keyword: '电商', // ← 改成你想搜的关键词
minLikes: 500, // ← 改成最低点赞数
dateFrom: null, // ← 开始日期(不限写 null)
dateTo: null, // ← 结束日期(不限写 null)
browser: 'chrome', // 浏览器:chrome 或 edge
maxScrolls: 60, // 滚动次数
};
示例:采集"跨境电商"、1000赞以上的笔记
const CONFIG = {
keyword: '跨境电商',
minLikes: 1000,
dateFrom: null,
dateTo: null,
// ...
};
📊 采集结果
运行后会在同目录生成 JSON 文件:
<skill目录>/scripts/xhs-{关键词}-{时间戳}.json
内容示例:
[
{
"title": "做电商8年,我们学到了什么?",
"author": "影视飓风",
"date": "2025-12-11",
"likes": "2.2万",
"link": "https://www.xiaohongshu.com/explore/xxx"
}
]
📋 飞书多维表格写入工作流
采集完成后,AI 自动执行以下步骤:
步骤 1:询问用户
采集完成!共采集到 X 条笔记。
是否写入飞书多维表格?
- ✅ 是:自动写入到飞书多维表格
- ❌ 否:仅保留 JSON 文件
步骤 2:用户提供飞书表格 URL 后,AI 执行写入
AI 调用飞书工具:
feishu_bitable_get_meta- 解析表格 URL,获取 app_token 和 table_idfeishu_bitable_list_fields- 确认字段名称feishu_bitable_create_record- 逐条写入数据
步骤 3:字段映射关系
| JSON 字段 | 说明 | 飞书字段类型 |
|-----------|------|------------|
| title | 笔记标题 | 文本 |
| author | 作者名称 | 文本 |
| date | 发布日期(YYYY-MM-DD)| 日期 |
| likes | 点赞数 | 数字 |
| link | 笔记链接 | URL |
步骤 4:写入示例代码
feishu_bitable_create_record({
app_token: '<飞书App Token>', // ← 从表格URL中获取
table_id: '<飞书Table ID>', // ← 从表格URL中获取
fields: {
'笔记标题': '<title>',
'作者名称': '<author>',
'发布日期': 1733875200000, // ← 日期转时间戳
'点赞': 22000,
'笔记链接': {
text: '查看笔记',
link: '<link>'
}
}
})
📂 批量写入优化
如果采集数量较多(>50条),AI 应该:
- 先询问用户确认写入数量
- 分批写入(每批 20-30 条)
- 显示进度:
[3/50] 写入中... - 写入完成后提供飞书表格链接
❓ 常见问题
Q: 运行报错"端口连接失败"
确保 Chrome 已加
--remote-debugging-port=9222参数打开
Q: 采集数量太少
增加
maxScrolls数值(如 100)
📁 文件结构
xhs-scraper/
├── SKILL.md
└── scripts/
├── extract.js # 主采集脚本
├── run_xhs.js # 辅助脚本
├── package.json # 依赖配置
└── node_modules/ # npm 依赖
扫码联系在线客服