小红书爆款笔记采集器 (xhs-scraper)

一键采集小红书搜索结果中的爆款笔记数据。

搭配工具

Ai运营助手 — 手机端 + 电脑浏览器插件多端采集进飞书表格，是整条链路的起点；

OpenClaw 无缝接表做分析与 skills 编排，把表格里的数据真正用起来。

👉 https://sph.shucaigang.cn/web/aiAssistant/index

📦 安装步骤

第1步：克隆 / 下载本 Skill

将本 Skill 目录放入 OpenClaw 的 skills 目录：

~/.qclaw/skills/xhs-scraper\

第2步：安装依赖

cd <skill目录>\scripts
npm install

如果提示没有 npm，先去下载 Node.js：https://nodejs.org/ （下载 LTS 版本）

第3步：打开浏览器

在 QClaw 里直接告诉 Agent：

"帮我打开小红书搜索 xxx"

或者手动打开 Chrome（加调试端口）：

找到 Chrome 快捷方式 → 右键 → 属性
在"目标"末尾加一个空格，然后粘贴：
```
--remote-debugging-port=9222
```
打开浏览器，登录小红书

第4步：运行采集

node <skill目录>/scripts/extract.js

或者直接告诉 QClaw Agent：

"运行小红书采集，关键词：电商"

⚙️ 如何修改采集条件

打开 <skill目录>/scripts/extract.js，找到 CONFIG 部分：

const CONFIG = {
  keyword: '电商',           // ← 改成你想搜的关键词
  minLikes: 500,             // ← 改成最低点赞数
  dateFrom: null,            // ← 开始日期（不限写 null）
  dateTo: null,              // ← 结束日期（不限写 null）
  browser: 'chrome',        // 浏览器：chrome 或 edge
  maxScrolls: 60,            // 滚动次数
};

示例：采集"跨境电商"、1000赞以上的笔记

const CONFIG = {
  keyword: '跨境电商',
  minLikes: 1000,
  dateFrom: null,
  dateTo: null,
  // ...
};

📊 采集结果

运行后会在同目录生成 JSON 文件：

<skill目录>/scripts/xhs-{关键词}-{时间戳}.json

内容示例：

[
  {
    "title": "做电商8年，我们学到了什么？",
    "author": "影视飓风",
    "date": "2025-12-11",
    "likes": "2.2万",
    "link": "https://www.xiaohongshu.com/explore/xxx"
  }
]

📋 飞书多维表格写入工作流

采集完成后，AI 自动执行以下步骤：

步骤 1：询问用户

采集完成！共采集到 X 条笔记。

是否写入飞书多维表格？
- ✅ 是：自动写入到飞书多维表格
- ❌ 否：仅保留 JSON 文件

步骤 2：用户提供飞书表格 URL 后，AI 执行写入

AI 调用飞书工具：

feishu_bitable_get_meta - 解析表格 URL，获取 app_token 和 table_id
feishu_bitable_list_fields - 确认字段名称
feishu_bitable_create_record - 逐条写入数据

步骤 3：字段映射关系

| JSON 字段 | 说明 | 飞书字段类型 | |-----------|------|------------| | title | 笔记标题 | 文本 | | author | 作者名称 | 文本 | | date | 发布日期（YYYY-MM-DD）| 日期 | | likes | 点赞数 | 数字 | | link | 笔记链接 | URL |

步骤 4：写入示例代码

feishu_bitable_create_record({
  app_token: '<飞书App Token>',      // ← 从表格URL中获取
  table_id: '<飞书Table ID>',        // ← 从表格URL中获取
  fields: {
    '笔记标题': '<title>',
    '作者名称': '<author>',
    '发布日期': 1733875200000,      // ← 日期转时间戳
    '点赞': 22000,
    '笔记链接': {
      text: '查看笔记',
      link: '<link>'
    }
  }
})

📂 批量写入优化

如果采集数量较多（>50条），AI 应该：

先询问用户确认写入数量
分批写入（每批 20-30 条）
显示进度：[3/50] 写入中...
写入完成后提供飞书表格链接

❓ 常见问题

Q: 运行报错"端口连接失败"

确保 Chrome 已加 --remote-debugging-port=9222 参数打开

Q: 采集数量太少

增加 maxScrolls 数值（如 100）

📁 文件结构

xhs-scraper/
├── SKILL.md
└── scripts/
    ├── extract.js        # 主采集脚本
    ├── run_xhs.js        # 辅助脚本
    ├── package.json      # 依赖配置
    └── node_modules/      # npm 依赖