金大哥 - token省流助手-最多节省70%token Skill 详情

Token 智能省流助手节省20%-70%token，可根据使用场景调整策略面向 QClaw / OpenClaw 本地智能体的轻量化 Token 优化工具一款专为本地大模型对话场景设计的无依赖、纯本地、安全可控的 Token 省流 Skill，可在不破坏语义、不改动代码逻辑、不影响模型理解能力的前提下，自动对用户输入文本、代码片段、对话内容进行智能压缩，显著降低单次对话与上下文长度，从而节省模型推理开销、延长对话窗口、提升响应速度并降低 Token 消耗。

核心功能

智能内容类型识别自动判断输入内容类型，采用差异化压缩策略：纯文本：日常提问、咨询、长句描述、闲聊对话代码内容：Python/Java/JS/Shell/HTML 等代码块混合内容：文字提问 + 代码示例组合场景识别准确率高，不会误判导致语义丢失或代码损坏。
三级可切换压缩强度支持用户通过自然语言自由切换压缩模式，全局记忆生效：轻度模式仅清理多余空格、换行、重复空白符，最大程度保留原文语气，适合需要完整表达的场景。默认模式（推荐）移除冗余语气词、礼貌用语、无效助词，适度简化长句，平衡省流效果与语义完整性。严格模式深度精简句式，删除连接词、代词、冗余修饰词，实现更高压缩比，适合长文本、连续对话。
文本深度优化（稳健增强）长句智能同义简化将 “我想请问一下你能不能帮我写一个爬虫” 自动简化为 “写一个爬虫”，不改变任务意图。冗余短语自动去重自动过滤 “谢谢”“好的”“明白了” 等高频无意义重复内容。空格与格式规范化统一换行、缩进、多空格，减少格式类 Token 浪费。
代码安全压缩（不破坏逻辑）仅压缩格式：空行、多余缩进、连续空格分级清理注释默认模式清除单行注释，严格模式进一步清除多行注释，大幅降低代码类 Token 占用不修改变量名、逻辑结构、语法关键字，压缩后代码可直接运行
系统指令保护机制自动识别并跳过以 “系统:、指令:、技能:、config:” 等开头的关键指令，避免因压缩导致功能异常、工具调用失败或智能体行为错乱。
实时 Token 节省统计精准估算原始 Token 与压缩后 Token 每轮对话自动展示本次节省 Token 数量展示当前压缩模式，用户一目了然
自然语言指令控制（无需传参）用户可直接开口控制，无需复杂参数配置：打开省 Token 提示 / 关闭省 Token 提示严格模式 / 轻度模式 / 默认模式最强压缩 / 正常模式等口语化指令

适用场景 QClaw / OpenClaw 本地智能体日常对话代码提问、编程辅助、长文本咨询上下文较长、容易超出模型窗口的对话希望降低本地模型显存占用、提升响应速度企业 / 个人私有化部署，追求安全、无外网依赖

QClaw 调用示例 json { "skill": "token_saver_qclaw", "params": { "text": "你好，我想请问一下怎么用QClaw部署一个本地大模型，谢谢" } } 返回结果示例： json { "status": "success", "content_type": "pure_text", "current_mode": "default", "original_token": 38, "compressed_token": 17, "token_saved": 21, "compressed_text": "用QClaw部署本地大模型", "tip": "已节省 21 Token（default模式）" }

支持指令清单提示开关打开省 token 提示关闭省 token 提示打开提示关闭提示压缩强度严格模式 / 最强压缩轻度模式 / 轻度压缩默认模式 / 正常模式 / 标准模式版本信息版本：6.0.0 稳健增强版适配平台：QClaw / OpenClaw 上架平台：SkillHub 运行方式：本地纯 Python 执行依赖：无任何第三方库