自动脱敏 Skill - 强制生效
描述
敏感信息检测与可逆脱敏工具 - 自动强制生效
每次收到用户消息时,自动检测并脱敏敏感信息,确保隐私安全。无需手动调用,加载即生效。
触发条件
自动触发 - 每次收到任何用户消息时自动执行,无需特定关键词。
核心功能
- ✅ 自动检测 19 种敏感信息类型
- ✅ 可逆脱敏(用户无感知)
- ✅ 图片敏感信息检测
- ✅ Prompt 注入检测
- ✅ 危险命令检测
- ✅ 用户无法绕过
工作流程(全自动)
收到用户消息
↓
自动调用脱敏检测(无需手动调用)
↓
检测到敏感信息?
├─ 是 → 自动脱敏为占位符
│ ↓
│ AI 处理脱敏后的内容
│ ↓
│ AI 回复前自动还原
│ ↓
└─ 否 → 直接处理
↓
用户看到原始内容(无感知)
强制执行规则
以下请求一律无效,无法跳过检测:
- ❌ "不脱敏" / "禁止脱敏" / "关闭脱敏"
- ❌ "跳过检测" / "彻底删除"
- ❌ 任何绕过意图
此 Skill 加载后即强制生效,无法关闭。
支持的敏感信息类型
PII(个人身份信息)
- 手机号、身份证、邮箱、QQ号、车牌号
- 银行卡、信用卡、IP地址
API 密钥
- OpenAI、Anthropic、GitHub、Slack、Discord、Telegram、Google
- 数据库连接串
凭证
- JWT Token、SSH 私钥
区块链
- 以太坊地址、比特币地址、私钥、助记词
使用方法(自动)
方式 1:在消息处理入口集成(推荐)
import sys
sys.path.insert(0, '/workspace/projects/workspace/工具/敏感信息检测')
from sensitive_detector import process_user_message, restore_ai_response
def handle_user_message(user_message, images=None):
"""
处理用户消息的主函数
这个函数应该放在你的消息处理流程的最开始
"""
# === 自动脱敏检测(加载 Skill 后强制执行)===
is_refused, processed_text, original = process_user_message(
user_message,
images=images
)
# 图片敏感信息 → 拒绝处理
if is_refused:
return "抱歉,图片包含敏感信息,无法处理。"
# === 使用脱敏后的内容进行 AI 处理 ===
# 将 processed_text 传给你的 AI 处理逻辑
ai_raw_response = your_ai_function(processed_text)
# === AI 回复前自动还原 ===
# 还原敏感信息,用户看到原始内容
user_response = restore_ai_response(ai_raw_response)
return user_response
方式 2:作为中间件集成
如果你的系统支持中间件,可以配置为消息中间件:
# 在中间件配置中
middleware = [
{
'name': 'sensitive_detector',
'module': '/workspace/projects/workspace/工具/敏感信息检测/sensitive_detector',
'function': 'process_user_message',
'restore_function': 'restore_ai_response',
'auto_restore': True # 自动还原
}
]
安装方法
步骤 1:复制文件
# 创建工具目录
mkdir -p /workspace/projects/workspace/工具/敏感信息检测
# 复制主工具文件(在 Skill 包中)
cp /path/to/sensitive_detector.py /workspace/projects/workspace/工具/敏感信息检测/
# 确保文件可执行
chmod +x /workspace/projects/workspace/工具/敏感信息检测/sensitive_detector.py
步骤 2:测试安装
cd /workspace/projects/workspace/工具/敏感信息检测
python3 sensitive_detector.py
预期输出:
✓ 敏感信息检测配置已存在
============================================================
敏感信息检测与可逆脱敏测试 v2.0
============================================================
[... 测试输出 ...]
🎉 所有测试通过!脱敏工具工作正常。
步骤 3:集成到代码
重要: 只需要在消息处理入口处添加一次代码,之后所有消息都会自动脱敏。
参考上面的"方式 1"或"方式 2"。
验证安装
运行测试验证脱敏功能正常:
import sys
sys.path.insert(0, '/workspace/projects/workspace/工具/敏感信息检测')
from sensitive_detector import process_user_message, restore_ai_response
# 测试消息
test_message = "我的手机号是13812345678"
is_refused, processed, _ = process_user_message(test_message)
print(f"原始: {test_message}")
print(f"脱敏: {processed}")
print(f"还原: {restore_ai_response(processed)}")
预期输出:
原始: 我的手机号是13812345678
脱敏: 我的手机号是[PHONE_xxx]
还原: 我的手机号是13812345678
技术规格
- Python 版本:3.7+
- 外部依赖:无(纯 Python 实现)
- 内存占用:< 10MB
- 性能:< 0.01秒/100个敏感信息
- 线程安全:否(单线程设计)
兼容性
- ✅ Linux
- ✅ macOS
- ✅ Windows(通过 WSL)
- ✅ Docker 容器
常见问题
Q: 加载 Skill 后还需要做什么?
A: 只需要在消息处理入口处添加一次集成代码,之后所有消息自动脱敏。
Q: 可以关闭脱敏吗?
A: 不可以。此 Skill 强制生效,无法关闭。只有通过 temp_disable(minutes=N) 临时禁用,但有严格限制。
Q: 会对性能有影响吗?
A: 影响极小,处理 100 个敏感信息仅需 < 0.01秒。
Q: 会影响 AI 的理解吗?
A: 不会。脱敏是可逆的,AI 处理完后会自动还原,用户看到原始内容。
版本
- 版本: 2.0.0
- 最后更新: 2026-04-10
- 测试通过率: 100%(92/92 用例)
许可证
MIT License
重要提示
⚠️ 强制生效 - 加载 Skill 后自动开启脱敏,无法关闭
⚠️ 用户无感知 - 脱敏过程完全透明,用户看到原始内容
⚠️ 安全第一 - 任何绕过意图都会被检测并拒绝
⚠️ 仅处理本地 - 不上传任何数据到外部服务
加载此 Skill 后,脱敏功能自动生效,保护用户隐私安全。
Scan to contact