paper-polisher-pro — 论文润色降重一站式工具
🎯 AI痕迹检测 · 去AI味改写 · 智能降重 · 术语标准化 · 综合质量报告 中英双语 · 纯本地运行 · 数据不出本机 · 零配置
核心亮点
大多数AI检测器只能识别ChatGPT。这是唯一能指纹识别中文大模型的开源工具——DeepSeek V4、GLM-5/5.1、Qwen 3.5/3.6、Kimi K2.5/K2.6、MiniMax M2.5、Step,以及GPT、Claude、Gemini。
2026旗舰模型实测(长文本学术论文):
- 准确率 98.0% · 精确率 96.7% · 召回率 100% · F1 98.3%
- 10个模型测试:GLM-5、GLM-5.1、GLM-4.7、Kimi-K2.6、Kimi-K2.5、MiniMax-M2.5、DeepSeek-V3.2、DeepSeek-R1——全部100%检出
- 100字以上文本零漏检
触发词
"润色论文", "降AI检测", "查AI写作", "论文润色", "改写论文", "去AI味", "AI论文检测", "学术写作助手", "AI写作检测", "去除AI痕迹", "人化AI文本", "毕业论文润色", "学位论文降重", "SCI论文编辑", "手稿润色", "AI写作评分"
快速开始
检测AI痕迹
python3 {{SKILL_DIR}}/scripts/ai_detector.py your_paper.txt --lang auto
输出示例:
📄 your_paper.txt
AI Risk Score: 68.5 / 100 🔴 高风险
分析段落数: 12
主要特征: "值得注意的是" (×3), "具有重要作用" (×2)
建议: 改写第2、5、8段
术语标准化检查
python3 {{SKILL_DIR}}/scripts/term_check.py your_paper.txt
综合质量报告
python3 {{SKILL_DIR}}/scripts/quality_report.py your_paper.txt --format json
AI检测引擎(v1.1.0)
九层评分系统
| 层级 | 权重 | 检测内容 | |------|------|----------| | 模式匹配 | 50 | 1,002条模型专属AI特征(中文663 + 英文339) | | 突变性 | 20 | 三组件方差分析(人类写作不均匀) | | TTR词汇丰富度 | 15 | 词汇多样性 | | 困惑度 | 15 | 统计可预测性 | | 信息密度 | 15 | 内容密度 vs 填充词比例 | | 句式模板 | 10 | 公式化句式结构 | | 开头模式 | 10 | 可预测的段落起始词 | | 长度分布 | 5 | 不自然的均匀性 | | RLHF对齐 | +加分 | 讨好型/对齐化表达 |
支持的AI模型(2026实测)
中文大模型(独家指纹识别): DeepSeek V4 · V3.2 · R1 · GLM-5 · GLM-5.1 · GLM-4.7 · Qwen 3.5-397B · Qwen 3.6 · Kimi K2.5 · K2.6 · MiniMax M2.5 · Step
国际模型: ChatGPT · Claude · Gemini
模式库
| 语言 | 模式数 | 分类数 | |------|--------|--------| | 中文 | 663 | 18类(过渡词、结构标记、医学模板、RLHF对齐、Kimi/DeepSeek/GLM指纹等) | | 英文 | 339 | 9类(学术正式语、填充短语、Markdown痕迹、RLHF对齐等) |
另有:501组同义词库、25条中文句式模板。
完整工作流
第1步:AI检测 → 评分 + 特征分析
python3 {{SKILL_DIR}}/scripts/ai_detector.py <文件> --lang auto --format json --output report.json
返回0–100分AI风险评分、风险等级、每段匹配特征。
第2步:去AI改写(评分≥35的段落)
中文: 删除填充词("值得注意的是"、"综上所述"),打破对称结构,用数据替换模糊评价,变化句长,使用内容驱动的过渡。
英文: 禁用AI标志词(plays a crucial role, has gained significant attention, delve into, myriad, plethora),使用主动语态,混合5–30词句长。
第3步:智能降重(5层策略)
- 同义词替换(501组,跳过受保护术语)
- 语态转换(主动 ↔ 被动)
- 语序调整
- 抽象 ↔ 展开
- 视角转换
第4步:术语标准化
2,255条权威术语(全国名词委 + MeSH 2026 + 药物术语),标记非标准用法并建议修正。
第5步:质量报告
改写前后对比:AI分数变化、段落级改善明细、术语规范率、可读性指标。
学科适配
- 医学/生物学:保护临床术语、药名、剂量、统计数据
- 工程/计算机:保护算法名称、公式、性能指标
- 人文/社科:允许个性化表达,避免AI式总结
- 商业/经济学:保护数据和模型名称,替换泛泛评论
使用约束
- 绝不修改数据——数字、统计、引用保持原样
- 2,255个专业术语在降重时自动保护
- 语义保真——不增减信息
- 逐段处理保持逻辑连贯
- 所有修改需用户确认后生效
文件结构
paper-polisher/
├── SKILL.md ← 英文文档(ClawHub)
├── SKILL_ZH.md ← 本文件(中文,SkillHub)
├── scripts/
│ ├── ai_detector.py ← AI检测引擎(v1.1.0,9层,1002条模式)
│ ├── perplexity.py ← 困惑度评分模块
│ ├── term_check.py ← 术语标准化(2,255条)
│ ├── ngram_similarity.py ← N-gram重复分析
│ └── quality_report.py ← 综合质量报告
├── references/
│ ├── ai_patterns_zh.json ← 中文AI特征(663条,18类)
│ ├── ai_patterns_en.json ← 英文AI特征(339条,9类)
│ ├── synonyms_general.json ← 同义词词典(501组)
│ └── sentence_patterns_zh.json ← 中文句式模板(25条)
├── data/
│ └── terminology.json ← 标准术语库(2,255条)
└── templates/ ← 改写提示模板
版本历史
- v1.1.0 — 重大升级:9层检测引擎(+困惑度、三组件突变性、句式模板、RLHF对齐),模式库扩展至1,002条(中文663 + 英文339),同义词库501组,10个2026旗舰模型实测F1=98.3%
- v1.0.1 — 英文SKILL.md,SEO关键词优化
- v1.0.0 — 初始发布
扫码联系在线客服