微信数据助手
1. 简介
微信生态数据查询工具,通过 MaxHub API 接入微信公众号(mp.weixin.qq.com)、视频号(Channels)与搜一搜(Search)三端,覆盖文章详情/统计/评论/回复/广告/相关推荐、公众号资料/文章列表/服务、视频号信息/视频详情/评论/分享/直播/合集、跨端搜一搜等全部能力。专注服务于公众号文章爬取、视频号内容研究、微信生态搜索、账号矩阵分析等场景,帮助用户在封闭的微信生态内系统化采集图文与视频数据,输出可分析的结构化结果。
2. 详细功能
公众号文章
- 通过文章链接还原公众号图文文章的完整正文,包括标题、作者、发布时间、富文本内容、配图
- 拉取文章的阅读量、在看数、点赞数、分享数等互动统计数据
- 拉取文章下的留言区评论与作者精选评论列表
- 拉取被精选评论的多层回复,还原完整对话
- 拉取与该文章相关联的延伸阅读推荐文章列表
- 获取文章内嵌的广告物料信息,用于商业内容研究
公众号账号
- 查询任意公众号的账号资料,包括账号名、简介、认证主体、头像、二维码等画像信息
- 分页拉取该公众号的历史文章列表,按时间倒序回溯全部发文记录
- 查询公众号开通的服务列表(菜单、商城、小程序等),构建账号矩阵全景
视频号视频
- 查询视频号视频的完整详情,包括标题、文案、封面、视频流地址、互动数据
- 支持通过视频对象 ID、导出 ID、分享链接三种入口反查同一条视频
- 拉取视频号视频下的评论列表,分析受众反馈与情感倾向
- 获取视频的对外分享链接,便于侧链分析与跨平台引流追踪
- 拉取某个视频号账号下的全部视频列表,用于内容矩阵盘点
视频号账号与合集
- 查询视频号账号的基本信息,包括账号名、简介、粉丝数、认证主体
- 查询视频号创作者的主页资料,构建独立的视频号 KOL 画像
- 拉取该视频号账号下的合集(专辑)列表
- 拉取某个合集内的全部视频,追踪连载/系列化内容
- 在某个视频号账号内按关键词搜索其历史视频
channel_id ↔ username 互转
- 把视频号短号(sph 短号 / channel_id)解析为标准账号用户名,解决跨入口数据互通问题
视频号直播
- 拉取某个视频号账号的历史直播列表,识别直播节奏与开播规律
- 查询某场直播的完整详情,包括直播标题、开播时间、回放链接、互动数据
微信搜一搜
- 通过搜一搜入口在微信生态内统一检索内容,支持公众号文章与视频号视频两种业务类型切换
- 一次搜索即可定位候选公众号、候选视频号、候选文章/视频,作为后续画像采集的入口
📋 数据传输与隐私声明(请认真阅读)
- 第三方传输:您提供的所有 ID、关键词、链接、cookie 等参数都会通过 HTTPS 发送到
https://www.aconfig.cn(MaxHub 数据服务)进行处理。- UGC 隐私:拉回的评论 / 弹幕 / 动态 / 私信 / 联系人等内容可能包含个人信息或敏感 UGC,请勿写入未授权的数据库或公开发布。
- 凭证保护:建议使用独立测试账号、定期轮换 API Key;禁止传入主力生产账号的 cookie 或 session 凭证。
- 合规责任:使用方需自行确保符合所在地区的数据保护法律(《个人信息保护法》/ GDPR / 平台 ToS 等),平台账号的合规性由使用方承担。
3. 一键安装
鉴权
获取 API Key
请前往 MaxHub 控制台 注册账号并获取 API Key。
配置 API Key
方案 1:OpenClaw 配置
将 MAXHUB_API_KEY 添加到 ~/.openclaw/openclaw.json 中:
{ "env": { "MAXHUB_API_KEY": "ak_xxxx..." } }
方案 2:终端环境变量
export MAXHUB_API_KEY="ak_xxxx..."
依赖安装
本 Skill 不需要额外脚本依赖,所有调用通过 curl 完成 HTTP 请求即可,无第三方库依赖。
环境变量配置
| 环境变量 | 说明 | 是否必填 | 获取方式 |
|---|---|---|---|
| MAXHUB_API_KEY | MaxHub 数据 API Key | 是 | MaxHub 控制台 |
4. 使用指南
🤖 Agent Decision Tree(必读 · 决定调用顺序)
此小节定义 agent 在每次接到用户请求时的标准决策流程。严格按此顺序执行可大幅提升命中率与减少误调用。
1️⃣ 文档加载顺序(按需 · 不要一次性全读)
| 步骤 | 何时读 | 加载文件 | 估算 token |
|------|-------|---------|-----------|
| ① 永远先读 | 接到任何请求时 | SKILL.md §0.1(不支持清单)+ §4(本节) | ~1K |
| ② 选择 recipe | 用户语义清晰时 | references/recipes/_index.md(仅索引) | ~1.5K |
| ③ 加载 recipe 详情 | 匹配到具体 recipe 时 | references/recipes/<domain>.md 的对应段落 | ~500/段 |
| ④ 加载端点详情 | 自定义链路或参数不明时 | references/<domain>.md 单文件 | ~3K |
| ⑤ 路径白名单校验 | 调用前 | grep '<endpoint_id>' references/endpoints_whitelist.yaml(禁止整体读) | ~50 行 |
| ⑥ 跨端点字段路由 | 链式调用时 | references/param-mappings.md § 字段流字典 | ~1K |
2️⃣ Recipe 匹配规则(核心)
- 加载
references/recipes/_index.md,扫trigger_keywords列 - 最长匹配优先:若用户输入同时命中多个 recipe 的 trigger,选最长 trigger 命中的那个(最具体)
- 平局询问:若两个 trigger 长度相同且都命中 → 主动询问用户:"您是想看 A 还是 B?"
- 无命中:先查 §0.1 不支持清单 → 不在则进入"自定义链路"流程(步骤 3)
3️⃣ 自定义链路(无现成 Recipe)
- 读
references/atoms/_index.md,按chain_role列定位起点(starter)和终点(terminal) - 优先用
⭐⭐⭐ 首选标记的端点;不到必要不用⭐ 条件端点 - 字段流(上游 OUT → 下游 IN)由
param-mappings.md § 字段流字典决定,禁止自行猜 json_path - 链路完成后,可向维护方建议把它编排成新 recipe
4️⃣ 调用前自检(按 risk 分级 · 节省 token)
| 端点 risk | 必做自检 | 步骤数 |
|----------|---------|-------|
| risk: low | ① 路径在 endpoints_whitelist.yaml | 1 步 |
| risk: medium | ① 路径 ② method ③ 必填参数 ④ 写入确认 | 4 步 |
| risk: high | 4 步 + 显式向用户确认参数与意图 | 5 步 |
| risk: critical(restricted) | 6 步高风险确认流程(详见 §高风险能力清单) | 6 步 |
旧 SKILL 强制所有调用都做 4 步——现按 risk 等级简化。
low端点(占绝大多数)只校验路径即可。
5️⃣ 错误处理快速决策
| 现象 | 行动 | 重试 |
|------|------|------|
| 404 / 410 | §3.1(A) 5 步防臆造自检 → 通过才 STOP;禁止自改路径段重试 | 0 |
| 400 / 422 | §3.1(B) 6 步防参数臆造自检 → 通过才修参重试 | ≤1 |
| 401 / 402 / 403 | STOP,告知用户去 https://www.aconfig.cn 处理 | 0 |
| 429 | 读 Retry-After 退避;无该头时指数退避+jitter | ≤2 |
| 5xx | 等 3 秒重试 → 仍失败走端点级"降级/替换" | 1 |
| HTTP 200 + code != 0 | 读 message_zh 报告用户;不重试(业务错误重试无用) | 0 |
6️⃣ 输出契约(与用户对话时)
- 数据来源声明:每次输出明确告知数据来自
https://www.aconfig.cn三方接口 - 缺失字段处理:如某字段链路降级后缺失,显式说明"X 暂不可取",不要静默省略
- 不要伪造:用户问的字段若不在响应里 → 说"未返回",禁止用其他端点拼凑模拟
核心约束(强制遵守)
| 规则 | 说明 |
|------|------|
| ⚠️ POST 写入语义 | 22 个端点全部为 POST 方法 + risk: high,参数走 JSON Body,非 query string,调用前必须用户确认参数 |
| 🔒 只读用途 | 虽然 HTTP 方法为 POST,但本技能仅用于数据查询,不执行写入 / 账户 / 发文 / 评论操作 |
| 🚫 禁止臆造路径 | 仅使用 references/endpoints_whitelist.yaml 中的端点,不得自行拼接、改版本号(v2)、加路径段 |
| 🚫 禁止重复调用 | POST 端点重复调用会重复扣配额,5xx 重试上限 1 次,业务错误 code != 0 不重试 |
| 📋 数据流向第三方 | 所有请求发送至 https://www.aconfig.cn,请使用独立测试账号并定期轮换 API Key |
| 🔑 凭证保护 | 不暴露 API Key、Cookie、Token 至日志或对话 |
基础使用(4 步完成调用)
Step 1 — 检查 API Key
[ -n "${MAXHUB_API_KEY:-}" ] && echo "ok" || echo "missing"
若返回 missing,停止并提示用户配置 MAXHUB_API_KEY。
Step 2 — 匹配意图 → 选择 reference
按用户目标从下表选择对应 reference 文件,每个文件自包含其领域的全部端点定义:
| 用户目标 | 加载文件 | 覆盖范围 |
|---------|---------|---------|
| 查公众号文章 / 评论 / 账号 | references/mp.md | 文章详情、统计、评论、回复、相关推荐、广告、账号资料、文章列表、服务(9 端点) |
| 查视频号 / 视频 / 直播 / 合集 | references/channels.md | 视频号信息、ID 互转、用户视频、视频详情、评论、分享 URL、用户资料、合集、直播(12 端点) |
| 搜一搜 / 跨端搜索 | references/search.md | 公众号 + 视频号统一搜索(1 端点) |
| 跨端点参数查询 / 字段流追溯 | references/param-mappings.md | 全局红线 + 端点路由 + 字段流字典 + 错误处理总览 |
| 路径白名单硬校验 | references/endpoints_whitelist.yaml | 22 个端点的硬白名单 + Pre-call 5 步自检协议(含 POST Body 校验) |
Step 3 — 构建最小调用计划
- ✅ 优先使用最少端点完成任务,能用一个端点就不用两个
- ✅ 调用任何端点前必须让用户确认 Body 参数(risk: high 强制要求)
- ✅ 视频号入口三选一(
object_id/export_id/share_url),不要同时携带 - ❌ 禁止"先 head/tail 试运行"或"先调一个看看"等探索性调用
Step 4 — 执行并验证
- 调用前比对
endpoints_whitelist.yaml完成 5 步 Pre-call 自检(路径 → method=POST → 必填 → 用户确认 → Body=JSON) - 收到 404 → 必须先做防路径臆造自检(5 步),不要立刻切换 mp/channels/search 段
- 收到 400 / 422 → 必须先做防参数臆造自检(6 步),重点检查
oneOf: [object_id, export_id, share_url]三选一 - 收到 业务 code != 0 → 读
message_zh报告用户,不重试(避免重复扣配额)
高级使用
链式调用图谱(Chain Recipes)
| 用户场景 | 链路 | 字段流 |
|---------|------|-------|
| 搜一搜 → 公众号文章 | fetch_search(business_type=mp) → fetch_article_detail | keyword → 文章 url |
| 查文章 + 评论 + 回复 | fetch_article_detail → fetch_article_comments → fetch_comment_replies | url 复用 + content_id |
| 查账号 → 文章列表 → 详情 | fetch_account_profile → fetch_account_articles → fetch_article_detail | username → 文章 url |
| 查视频号 → 视频详情 → 评论 | fetch_channel_info → fetch_user_videos → fetch_video_detail → fetch_video_comments | username → object_id |
| channel_id → username | fetch_channel_id_to_username → 后续视频号端点 | channel_id → username |
| 视频号直播追踪 | fetch_channel_info → fetch_live_history → fetch_live_detail | username → live_id |
| 视频号合集 | fetch_user_collections → fetch_collection_videos | username → topic_id |
| 视频号内搜索 | fetch_search_channel_videos | username + keyword 双必填 |
防臆造自检清单(强制前置步骤)
收到 404 时(A):
- 路径白名单逐字符比对(注意
/wechat_mp/v2/vs/wechat_channels/v2/vs/wechat_search/v2/)→ 不在清单中 STOP - Method 比对(全部为 POST,不是 GET)→ 不等 STOP
- 参数键名比对(
url/username/object_id不可互换)→ 有清单外参数 STOP - 资源 ID 来源溯源 → Agent 编造的 STOP
- 全通过才判定"上游资源不存在"
收到 400 / 422 时(B):
- 参数名严格比对(大小写 / 缩写 / 复数)
- 必填项齐全 + oneOf 三选一逻辑(视频详情
object_id/export_id/share_url) - POST Body 是否为合法 JSON(非 query string、非表单)
- Content-Type 是否为
application/json - 类型与格式严格匹配(pattern / enum)
- 全通过才按
message_zh排查
POST 端点最佳实践
- JSON Body 序列化:使用语言原生 JSON 序列化,不要手拼字符串
- Content-Type 必填:
-H "Content-Type: application/json" - 重试策略:5xx 重试 ≤ 1 次;4xx / 业务错误不重试,避免重复扣配额
- 用户确认门槛:所有端点
risk: high,调用前必须把完整 Body 给用户确认
SKILL 版本更新
| 触发条件 | 推荐操作 |
|---------|---------|
| 合法路径持续 404 / 410 | skillhub upgrade maxhub-wechat(国内)或 clawhub upgrade maxhub-wechat(国际) |
| 用户问"版本是多少" | 当前版本 v3.7.2,访问 https://skillhub.cn/skills/maxhub-wechat |
| 多端点连续 410 | skillhub upgrade maxhub-wechat --force |
| 401 / 402 / 403 | 不是版本问题,去 https://www.aconfig.cn 处理 |
常用命令速查表
| 场景 | 命令 |
|---|---|
| 查 API Key | [ -n "${MAXHUB_API_KEY:-}" ] && echo "ok" \|\| echo "missing" |
| 查公众号文章详情 | curl -X POST -H "$maxhub_auth_header" -H "Content-Type: application/json" -d '{"url":"https://mp.weixin.qq.com/s/xxx"}' "https://www.aconfig.cn/api/v1/wechat_mp/v2/fetch_article_detail" |
| 查文章评论 | curl -X POST -H "$maxhub_auth_header" -H "Content-Type: application/json" -d '{"url":"https://mp.weixin.qq.com/s/xxx"}' "https://www.aconfig.cn/api/v1/wechat_mp/v2/fetch_article_comments" |
| 查公众号文章列表 | curl -X POST -H "$maxhub_auth_header" -H "Content-Type: application/json" -d '{"username":"gh_xxx"}' "https://www.aconfig.cn/api/v1/wechat_mp/v2/fetch_account_articles" |
| 查视频号视频详情 | curl -X POST -H "$maxhub_auth_header" -H "Content-Type: application/json" -d '{"object_id":"xxx"}' "https://www.aconfig.cn/api/v1/wechat_channels/v2/fetch_video_detail" |
| 搜一搜 | curl -X POST -H "$maxhub_auth_header" -H "Content-Type: application/json" -d '{"keyword":"AI"}' "https://www.aconfig.cn/api/v1/wechat_search/v2/fetch_search" |
| 检查 SKILL 更新 | skillhub info maxhub-wechat 或 clawhub info maxhub-wechat |
📌 端到端使用示例(agent 快速上手)
用户输入:「帮我看 微信公众号某篇文章的评论」
Agent 执行步骤:
- 匹配 recipe:读
references/recipes/_index.md→ 找到 trigger 命中 → 选最长匹配的 recipe - 加载 recipe 详情:读
references/recipes/<domain>.md中对应段落,拿到 Inputs / Atomic Steps / Output - 路径校验:对每个 atom 的 endpoint_id,
grep一下endpoints_whitelist.yaml确认存在 - risk: low 的端点直接调用,risk: medium+ 先与用户确认
- 链式传递:上游响应的 json_path 字段(如
$.data.bvid)按 recipe 的extract列绑定为变量,传给下游端点 - 错误处理:按 §错误处理决策表行动;不要自改路径或瞎加参数
- 输出:组装结果给用户,标明数据来自三方接口;缺失字段显式说"未取到"
反例(agent 不要这么做):
- ❌ 全文加载
endpoints_whitelist.yaml(大文件,浪费上下文) - ❌ 看到 404 就改路径段重试(会被防臆造规则阻断)
- ❌ 把没在响应里的字段编一个值返回给用户
- ❌ 链式调用时忽略 recipe 的
extract列,自己猜 json_path
5. 使用场景
场景一:研究员批量爬取公众号文章
- 角色:行业研究员 / 自媒体编辑
- 需求:批量采集某垂类(科技 / 财经 / 教育)头部公众号近 3 个月文章正文与互动数据
- 使用方式:
fetch_search(business_type=mp) → 取候选公众号username→fetch_account_profile验证 →fetch_account_articles(分页)拉文章 URL →fetch_article_detail+fetch_article_stats拉正文与阅读数 - 预期收益:完整公众号文章语料库 + 阅读/在看数据,支撑选题分析与内容选品
场景二:MCN 团队视频号内容研究
- 角色:视频号运营 / MCN 内容策划
- 需求:分析头部视频号近期爆款视频的封面、标题、互动数据,沉淀爆款公式
- 使用方式:
fetch_channel_info锁定账号 →fetch_user_videos拉视频列表 → 取object_id→fetch_video_detail+fetch_video_comments取详情与评论 → 必要时fetch_video_share_url取分享链接做侧链分析 - 预期收益:视频号爆款样本集 + 评论情感分析,提炼可复用的视频号选题模板
场景三:增长团队微信生态搜索调研
- 角色:增长 PM / 竞品分析师
- 需求:在微信生态(公众号 + 视频号)内调研竞品关键词的曝光分布与头部账号
- 使用方式:
fetch_search跨端搜索(business_type 切换 mp/channels) → 取头部公众号 / 视频号 → 链式调fetch_account_profile/fetch_channel_info补全画像 - 预期收益:完整微信生态竞品图谱,识别公众号 + 视频号双端的内容投放分布
场景四:数据团队账号矩阵分析
- 角色:数据分析师 / 品牌策略
- 需求:评估某品牌的微信账号矩阵(多个公众号 + 多个视频号)整体内容产能与互动健康度
- 使用方式:批量传入
username列表 → 并行调用fetch_account_profile+fetch_account_articles+fetch_channel_info+fetch_user_videos→ 汇总文章数 / 视频数 / 平均互动 → 输出账号矩阵看板 - 预期收益:账号矩阵健康度报表,识别高产 / 低产账号与内容产能差距
6. 项目架构
目录结构
maxhub-wechat/
├── SKILL.md # Skill 定义与使用文档(本文件)
├── README.md # 英文项目说明
├── README_CN.md # 中文项目说明
├── _meta.json # 版本元信息(version: 3.7.2)
└── references/
├── endpoints_whitelist.yaml # 22 端点路径硬白名单 + Pre-call 5 步自检协议(含 POST Body 校验)
├── param-mappings.md # 中枢索引(全局红线 + 字段流字典 + 错误处理)
├── mp.md # 公众号域:文章详情/统计/评论/回复/广告/账号(9 端点,全 POST)
├── channels.md # 视频号域:信息/视频/评论/分享/合集/直播(12 端点,全 POST)
└── search.md # 搜一搜域:跨端统一搜索(1 端点,POST)
技术栈
| 组件 | 技术 | 说明 |
|------|------|------|
| 调用方式 | curl + Bearer Token + JSON Body | HTTP POST 请求,参数走 JSON Body,需带 Content-Type: application/json |
| 数据接口 | MaxHub API | https://www.aconfig.cn/api/v1/{wechat_mp\|wechat_channels\|wechat_search}/v2/*,通过 MAXHUB_API_KEY 鉴权 |
| 路径校验 | YAML 硬白名单 | endpoints_whitelist.yaml 提供 22 端点的逐字符校验 + 5 步 Pre-call 协议(含 POST Body=JSON 校验) |
| 错误处理 | 决策表 + 自检清单 | HTTP 状态码权威定义 + 防臆造自检(A/B 双轨)+ POST 重试策略(5xx ≤ 1 次) |
| 输出格式 | JSON Standard MaxHub Response | {code, message, message_zh, data, cache_url} |
| 更新通道 | SkillHub / ClawHub / GitHub | 国内 ⭐⭐⭐ SkillHub(腾讯云 CDN)/ 国际 ⭐⭐⭐ ClawHub / 降级 GitHub |
API 覆盖范围
| 领域 | 端点数 | HTTP 方法 | 风险等级 | Reference 文件 |
|------|--------|----------|----------|---------------|
| 公众号(MP) | 9 | POST | high | mp.md |
| 视频号(Channels) | 12 | POST | high | channels.md |
| 搜一搜(Search) | 1 | POST | high | search.md |
| 合计 | 22 | 全 POST | 全 high | — |
关键设计理念
- POST 写入语义全管控:22 个端点全部 POST + risk:high,强制用户确认参数,5xx 重试 ≤ 1 次,杜绝重复扣配额
- 防臆造四道闸:白名单(endpoints_whitelist.yaml)→ 强标记(Full path)→ 禁止规则(Forbidden)→ 错误反馈(STOP)
- 三端段隔离:
/wechat_mp/v2///wechat_channels/v2///wechat_search/v2/路径段不可混用 - Agent 友好 7 大原则:结构胜于叙述、明确指令优于建议、单一来源、词法稳定性、低 token 密度、边界显式声明、错误处理是契约
- 链式调用图谱:字段流字典 + Chain Recipes + 跨 reference 链路三层联动,杜绝 Agent 编造字段名
- 错误处理契约:HTTP 状态码权威定义 + 防臆造自检清单(A: 5 步 / B: 6 步含 POST Body 校验)+ POST 重试策略矩阵
Scan to join WeChat group