Back to skills
extension
Category: OtherAPI key required

小红书违禁词检测改写

检测小红书(XHS)文案中的违禁词,判断违禁程度并给出替换建议。输入飞书多维表格链接,自动读取笔记标题/笔记内容,检测后批量回写修改。触发关键词包括:小红书违禁词、检查文案、笔记违规、违禁检测、XHS检测、小红书合规、检查这段话有没有违禁词、帮我查一下这条笔记、批量违禁词、飞书违禁词、违禁词修改、违禁词替换、笔记合规检查。

personAuthor: user_88ed8f47hubcommunity

小红书违禁词检测改写技能

概述

本技能基于完整的小红书违禁词库(289 条),从飞书多维表格批量读取笔记标题和笔记内容,进行逐词违禁词检测,按四级违禁程度分类,提供风险等级和安全替换建议,并支持批量回写修改。

使用方式:输入飞书多维表格链接 → 自动读取 → 检测 → 输出报告 → 批量修改

词库覆盖:289 个独立违禁词,来源为「小红书违禁词整理(按违禁程度分类).xlsx」,包含以下 4 个工作表:

| 工作表 | 违禁程度 | 词数(≈) | |--------|----------|-----------| | 🔴绝对违禁词 | 🔴绝对违禁 | ~80 条 | | 🟡敏感词 | 🟡敏感 | ~47 条 | | 🟠行业限制词 | 🟠行业限制 | ~86 条 | | ⚫规避手段词 | ⚫规避 | ~58 条 |

违禁程度定义

| 级别 | 标签 | 含义 | 后果 | |------|------|------|------| | 🔴绝对违禁 | 绝对违禁 | 触碰平台底线,一碰即触发审核 | 限流、删笔记、封号 | | 🟡敏感词 | 敏感 | 涉及敏感/争议话题 | 降低笔记权重,谨慎使用 | | 🟠行业限制 | 行业限制 | 各行业夸大/绝对化表述 | 根据严重程度判定违规 | | ⚫规避手段 | 规避 | 拼音/谐音/符号/错别字替代 | 同样违规,不可使用 |

飞书配置

使用前需配置飞书应用凭证。

配置方式(三选一)

  1. 命令行参数--app-id XXX --app-secret XXX
  2. 环境变量FEISHU_APP_ID + FEISHU_APP_SECRET
  3. 对话中告知:在对话中提供 APP_ID 和 APP_SECRET,WorkBuddy 会自动传入

飞书应用权限要求

| 权限 | 用途 | |------|------| | bitable:base:read | 读取多维表格记录 | | bitable:base:edit | 批量更新记录(修改违禁词) |

多维表格字段要求

| 字段名 | 类型 | 说明 | |--------|------|------| | 笔记标题 | 文本 | 要检测的笔记标题(可通过 --title-field 自定义) | | 笔记内容 | 文本 | 要检测的笔记正文(可通过 --content-field 自定义) |

工作流程

Step 1 — 解析链接

从用户提供的飞书多维表格链接中解析 APP_TOKENTABLE_IDVIEW_ID

支持链接格式:

  • https://xxx.feishu.cn/base/APP_TOKEN?table=TABLE_ID&view=VIEW_ID
  • https://xxx.feishu.cn/base/APP_TOKEN/table/TABLE_ID?view=VIEW_ID

Step 2 — 首次检测(dry-run)

python scripts/check_bitable.py --url "飞书多维表格链接" --app-id XXX --app-secret XXX --dry-run

重要:首次检测必须使用 --dry-run,仅输出报告不修改数据,让用户确认后再执行修改。

Step 3 — 展示检测报告

报告包含以下板块:

  1. 检测详情:逐条记录列出命中的违禁词、所在位置、风险等级、安全替换、是否可自动替换
  2. 风险总览:违禁词总数、按四级分类统计、可自动替换/需手动修改数量、综合风险等级
  3. 规避手段提示:如果检测到拼音/谐音/符号等规避手段

Step 4 — 用户确认后批量修改

用户确认报告内容后,去掉 --dry-run 执行修改:

python scripts/check_bitable.py --url "飞书多维表格链接" --app-id XXX --app-secret XXX

修改规则

  • 直接覆盖「笔记标题」「笔记内容」原字段
  • 仅替换有安全替换词且词长≥2的违禁词(标记为 ✅ 可自动替换)
  • 无安全替换词或词过短的违禁词(标记为 ❌ 需手动修改)不自动替换
  • 修改完成后输出修改汇总

Step 5 — 输出修改汇总

列出每条记录的具体替换详情:

  • 记录编号 + 标题预览
  • 每处替换:「原词」→「替换词」

可选参数

| 参数 | 说明 | 默认值 | |------|------|--------| | --title-field | 笔记标题字段名 | 笔记标题 | | --content-field | 笔记内容字段名 | 笔记内容 | | --dry-run | 仅检测不修改 | 否 | | --report | 报告输出文件路径 | 不输出文件 |

检测原则

  1. 不遗漏:4 个工作表全部逐一检查,不得跳过
  2. 区分程度:同一词可能同时触发多个类别时,按最高违禁程度定级
  3. 模糊容忍:中文近义词/同义词模式也须识别(如「一流」=「第一」=「顶尖」)
  4. 建议合理:安全替换词须语义相近且不引入新违禁风险
  5. 谨慎替换:自动替换仅限词长≥2且有明确安全替换词的违禁词,避免误替换
  6. 仅输出结果:不做道德评判,不额外延伸,直接给出检测结论

资源

references/

  • 违禁词库.md:完整违禁词数据库,包含全部 289 个词条及其分类、风险等级、替换建议。每次检测前必须读取,不得遗漏任何工作表。
  • 使用说明.md:用户使用说明文档,包含完整的使用步骤、凭证配置、常见问题等。

scripts/

  • check_bitable.py:飞书多维表格批量检测与修改脚本。输入飞书链接,自动读取记录、检测违禁词、输出报告、批量回写修改。