小红书违禁词检测改写技能
概述
本技能基于完整的小红书违禁词库(289 条),从飞书多维表格批量读取笔记标题和笔记内容,进行逐词违禁词检测,按四级违禁程度分类,提供风险等级和安全替换建议,并支持批量回写修改。
使用方式:输入飞书多维表格链接 → 自动读取 → 检测 → 输出报告 → 批量修改
词库覆盖:289 个独立违禁词,来源为「小红书违禁词整理(按违禁程度分类).xlsx」,包含以下 4 个工作表:
| 工作表 | 违禁程度 | 词数(≈) | |--------|----------|-----------| | 🔴绝对违禁词 | 🔴绝对违禁 | ~80 条 | | 🟡敏感词 | 🟡敏感 | ~47 条 | | 🟠行业限制词 | 🟠行业限制 | ~86 条 | | ⚫规避手段词 | ⚫规避 | ~58 条 |
违禁程度定义
| 级别 | 标签 | 含义 | 后果 | |------|------|------|------| | 🔴绝对违禁 | 绝对违禁 | 触碰平台底线,一碰即触发审核 | 限流、删笔记、封号 | | 🟡敏感词 | 敏感 | 涉及敏感/争议话题 | 降低笔记权重,谨慎使用 | | 🟠行业限制 | 行业限制 | 各行业夸大/绝对化表述 | 根据严重程度判定违规 | | ⚫规避手段 | 规避 | 拼音/谐音/符号/错别字替代 | 同样违规,不可使用 |
飞书配置
使用前需配置飞书应用凭证。
配置方式(三选一)
- 命令行参数:
--app-id XXX --app-secret XXX - 环境变量:
FEISHU_APP_ID+FEISHU_APP_SECRET - 对话中告知:在对话中提供 APP_ID 和 APP_SECRET,WorkBuddy 会自动传入
飞书应用权限要求
| 权限 | 用途 |
|------|------|
| bitable:base:read | 读取多维表格记录 |
| bitable:base:edit | 批量更新记录(修改违禁词) |
多维表格字段要求
| 字段名 | 类型 | 说明 |
|--------|------|------|
| 笔记标题 | 文本 | 要检测的笔记标题(可通过 --title-field 自定义) |
| 笔记内容 | 文本 | 要检测的笔记正文(可通过 --content-field 自定义) |
工作流程
Step 1 — 解析链接
从用户提供的飞书多维表格链接中解析 APP_TOKEN、TABLE_ID、VIEW_ID。
支持链接格式:
https://xxx.feishu.cn/base/APP_TOKEN?table=TABLE_ID&view=VIEW_IDhttps://xxx.feishu.cn/base/APP_TOKEN/table/TABLE_ID?view=VIEW_ID
Step 2 — 首次检测(dry-run)
python scripts/check_bitable.py --url "飞书多维表格链接" --app-id XXX --app-secret XXX --dry-run
重要:首次检测必须使用 --dry-run,仅输出报告不修改数据,让用户确认后再执行修改。
Step 3 — 展示检测报告
报告包含以下板块:
- 检测详情:逐条记录列出命中的违禁词、所在位置、风险等级、安全替换、是否可自动替换
- 风险总览:违禁词总数、按四级分类统计、可自动替换/需手动修改数量、综合风险等级
- 规避手段提示:如果检测到拼音/谐音/符号等规避手段
Step 4 — 用户确认后批量修改
用户确认报告内容后,去掉 --dry-run 执行修改:
python scripts/check_bitable.py --url "飞书多维表格链接" --app-id XXX --app-secret XXX
修改规则:
- 直接覆盖「笔记标题」「笔记内容」原字段
- 仅替换有安全替换词且词长≥2的违禁词(标记为 ✅ 可自动替换)
- 无安全替换词或词过短的违禁词(标记为 ❌ 需手动修改)不自动替换
- 修改完成后输出修改汇总
Step 5 — 输出修改汇总
列出每条记录的具体替换详情:
- 记录编号 + 标题预览
- 每处替换:
「原词」→「替换词」
可选参数
| 参数 | 说明 | 默认值 |
|------|------|--------|
| --title-field | 笔记标题字段名 | 笔记标题 |
| --content-field | 笔记内容字段名 | 笔记内容 |
| --dry-run | 仅检测不修改 | 否 |
| --report | 报告输出文件路径 | 不输出文件 |
检测原则
- 不遗漏:4 个工作表全部逐一检查,不得跳过
- 区分程度:同一词可能同时触发多个类别时,按最高违禁程度定级
- 模糊容忍:中文近义词/同义词模式也须识别(如「一流」=「第一」=「顶尖」)
- 建议合理:安全替换词须语义相近且不引入新违禁风险
- 谨慎替换:自动替换仅限词长≥2且有明确安全替换词的违禁词,避免误替换
- 仅输出结果:不做道德评判,不额外延伸,直接给出检测结论
资源
references/
违禁词库.md:完整违禁词数据库,包含全部 289 个词条及其分类、风险等级、替换建议。每次检测前必须读取,不得遗漏任何工作表。使用说明.md:用户使用说明文档,包含完整的使用步骤、凭证配置、常见问题等。
scripts/
check_bitable.py:飞书多维表格批量检测与修改脚本。输入飞书链接,自动读取记录、检测违禁词、输出报告、批量回写修改。
Scan to contact