Token 智能省流助手 节省20%-70%token,可根据使用场景调整策略 面向 QClaw / OpenClaw 本地智能体的轻量化 Token 优化工具 一款专为本地大模型对话场景设计的无依赖、纯本地、安全可控的 Token 省流 Skill,可在不破坏语义、不改动代码逻辑、不影响模型理解能力的前提下,自动对用户输入文本、代码片段、对话内容进行智能压缩,显著降低单次对话与上下文长度,从而节省模型推理开销、延长对话窗口、提升响应速度并降低 Token 消耗。
核心功能
-
智能内容类型识别 自动判断输入内容类型,采用差异化压缩策略: 纯文本:日常提问、咨询、长句描述、闲聊对话 代码内容:Python/Java/JS/Shell/HTML 等代码块 混合内容:文字提问 + 代码示例组合场景 识别准确率高,不会误判导致语义丢失或代码损坏。
-
三级可切换压缩强度 支持用户通过自然语言自由切换压缩模式,全局记忆生效: 轻度模式 仅清理多余空格、换行、重复空白符,最大程度保留原文语气,适合需要完整表达的场景。 默认模式(推荐) 移除冗余语气词、礼貌用语、无效助词,适度简化长句,平衡省流效果与语义完整性。 严格模式 深度精简句式,删除连接词、代词、冗余修饰词,实现更高压缩比,适合长文本、连续对话。
-
文本深度优化(稳健增强) 长句智能同义简化 将 “我想请问一下你能不能帮我写一个爬虫” 自动简化为 “写一个爬虫”,不改变任务意图。 冗余短语自动去重 自动过滤 “谢谢”“好的”“明白了” 等高频无意义重复内容。 空格与格式规范化 统一换行、缩进、多空格,减少格式类 Token 浪费。
-
代码安全压缩(不破坏逻辑) 仅压缩格式:空行、多余缩进、连续空格 分级清理注释 默认模式清除单行注释,严格模式进一步清除多行注释,大幅降低代码类 Token 占用 不修改变量名、逻辑结构、语法关键字,压缩后代码可直接运行
-
系统指令保护机制 自动识别并跳过以 “系统:、指令:、技能:、config:” 等开头的关键指令,避免因压缩导致功能异常、工具调用失败或智能体行为错乱。
-
实时 Token 节省统计 精准估算原始 Token 与压缩后 Token 每轮对话自动展示本次节省 Token 数量 展示当前压缩模式,用户一目了然
-
自然语言指令控制(无需传参) 用户可直接开口控制,无需复杂参数配置: 打开省 Token 提示 / 关闭省 Token 提示 严格模式 / 轻度模式 / 默认模式 最强压缩 / 正常模式 等口语化指令
适用场景 QClaw / OpenClaw 本地智能体日常对话 代码提问、编程辅助、长文本咨询 上下文较长、容易超出模型窗口的对话 希望降低本地模型显存占用、提升响应速度 企业 / 个人私有化部署,追求安全、无外网依赖
QClaw 调用示例 json { "skill": "token_saver_qclaw", "params": { "text": "你好,我想请问一下怎么用QClaw部署一个本地大模型,谢谢" } } 返回结果示例: json { "status": "success", "content_type": "pure_text", "current_mode": "default", "original_token": 38, "compressed_token": 17, "token_saved": 21, "compressed_text": "用QClaw部署本地大模型", "tip": "已节省 21 Token(default模式)" }
支持指令清单 提示开关 打开省 token 提示 关闭省 token 提示 打开提示 关闭提示 压缩强度 严格模式 / 最强压缩 轻度模式 / 轻度压缩 默认模式 / 正常模式 / 标准模式 版本信息 版本:6.0.0 稳健增强版 适配平台:QClaw / OpenClaw 上架平台:SkillHub 运行方式:本地纯 Python 执行 依赖:无任何第三方库
扫码联系在线客服