小红书违禁词检测改写技能

概述

本技能基于完整的小红书违禁词库（289 条），从飞书多维表格批量读取笔记标题和笔记内容，进行逐词违禁词检测，按四级违禁程度分类，提供风险等级和安全替换建议，并支持批量回写修改。

使用方式：输入飞书多维表格链接 → 自动读取 → 检测 → 输出报告 → 批量修改

词库覆盖：289 个独立违禁词，来源为「小红书违禁词整理（按违禁程度分类）.xlsx」，包含以下 4 个工作表：

| 工作表 | 违禁程度 | 词数（≈） | |--------|----------|-----------| | 🔴绝对违禁词 | 🔴绝对违禁 | ~80 条 | | 🟡敏感词 | 🟡敏感 | ~47 条 | | 🟠行业限制词 | 🟠行业限制 | ~86 条 | | ⚫规避手段词 | ⚫规避 | ~58 条 |

违禁程度定义

| 级别 | 标签 | 含义 | 后果 | |------|------|------|------| | 🔴绝对违禁 | 绝对违禁 | 触碰平台底线，一碰即触发审核 | 限流、删笔记、封号 | | 🟡敏感词 | 敏感 | 涉及敏感/争议话题 | 降低笔记权重，谨慎使用 | | 🟠行业限制 | 行业限制 | 各行业夸大/绝对化表述 | 根据严重程度判定违规 | | ⚫规避手段 | 规避 | 拼音/谐音/符号/错别字替代 | 同样违规，不可使用 |

飞书配置

使用前需配置飞书应用凭证。

配置方式（三选一）

命令行参数：--app-id XXX --app-secret XXX
环境变量：FEISHU_APP_ID + FEISHU_APP_SECRET
对话中告知：在对话中提供 APP_ID 和 APP_SECRET，WorkBuddy 会自动传入

飞书应用权限要求

| 权限 | 用途 | |------|------| | bitable:base:read | 读取多维表格记录 | | bitable:base:edit | 批量更新记录（修改违禁词） |

多维表格字段要求

| 字段名 | 类型 | 说明 | |--------|------|------| | 笔记标题 | 文本 | 要检测的笔记标题（可通过 --title-field 自定义） | | 笔记内容 | 文本 | 要检测的笔记正文（可通过 --content-field 自定义） |

工作流程

Step 1 — 解析链接

从用户提供的飞书多维表格链接中解析 APP_TOKEN、TABLE_ID、VIEW_ID。

支持链接格式：

https://xxx.feishu.cn/base/APP_TOKEN?table=TABLE_ID&view=VIEW_ID
https://xxx.feishu.cn/base/APP_TOKEN/table/TABLE_ID?view=VIEW_ID

Step 2 — 首次检测（dry-run）

python scripts/check_bitable.py --url "飞书多维表格链接" --app-id XXX --app-secret XXX --dry-run

重要：首次检测必须使用 --dry-run，仅输出报告不修改数据，让用户确认后再执行修改。

Step 3 — 展示检测报告

报告包含以下板块：

检测详情：逐条记录列出命中的违禁词、所在位置、风险等级、安全替换、是否可自动替换
风险总览：违禁词总数、按四级分类统计、可自动替换/需手动修改数量、综合风险等级
规避手段提示：如果检测到拼音/谐音/符号等规避手段

Step 4 — 用户确认后批量修改

用户确认报告内容后，去掉 --dry-run 执行修改：

python scripts/check_bitable.py --url "飞书多维表格链接" --app-id XXX --app-secret XXX

修改规则：

直接覆盖「笔记标题」「笔记内容」原字段
仅替换有安全替换词且词长≥2的违禁词（标记为 ✅ 可自动替换）
无安全替换词或词过短的违禁词（标记为 ❌ 需手动修改）不自动替换
修改完成后输出修改汇总

Step 5 — 输出修改汇总

列出每条记录的具体替换详情：

记录编号 + 标题预览
每处替换：「原词」→「替换词」

可选参数

| 参数 | 说明 | 默认值 | |------|------|--------| | --title-field | 笔记标题字段名 | 笔记标题 | | --content-field | 笔记内容字段名 | 笔记内容 | | --dry-run | 仅检测不修改 | 否 | | --report | 报告输出文件路径 | 不输出文件 |

检测原则

不遗漏：4 个工作表全部逐一检查，不得跳过
区分程度：同一词可能同时触发多个类别时，按最高违禁程度定级
模糊容忍：中文近义词/同义词模式也须识别（如「一流」=「第一」=「顶尖」）
建议合理：安全替换词须语义相近且不引入新违禁风险
谨慎替换：自动替换仅限词长≥2且有明确安全替换词的违禁词，避免误替换
仅输出结果：不做道德评判，不额外延伸，直接给出检测结论

资源

references/

违禁词库.md：完整违禁词数据库，包含全部 289 个词条及其分类、风险等级、替换建议。每次检测前必须读取，不得遗漏任何工作表。
使用说明.md：用户使用说明文档，包含完整的使用步骤、凭证配置、常见问题等。

scripts/

check_bitable.py：飞书多维表格批量检测与修改脚本。输入飞书链接，自动读取记录、检测违禁词、输出报告、批量回写修改。