Caveman:开源AI文本压缩工具,高比例精简对话节省Token

原创 发布日期:
67

一、Caveman 是什么

Caveman 是一款开源的AI 会话文本压缩工具,专为 AI 编程助手、大模型对话场景设计。项目核心设计理念源自“原始人极简沟通逻辑”:剔除大模型回复中冗余客套、修饰性语句、重复铺垫、无效冠词与废话文本,在100%保留核心技术信息、代码逻辑、业务要点不变的前提下,极致压缩输出文本体积。

该项目原生适配 Claude Code、Cursor、Gemini CLI、GitHub Copilot 等三十余款主流 AI 编程智能体与大模型客户端,不改变大模型推理能力、不篡改专业内容,仅对输入输出文本进行轻量化规整压缩,实现减少 Token 消耗、提升响应速度、降低使用成本、精简阅读体验四大核心价值。

不同于普通文本精简工具,Caveman 专为代码开发、工程协作、PR 代码评审、Git 提交备注、AI 长会话记忆压缩等技术场景深度定制,支持多档位压缩模式、文言文压缩、子代理协同压缩、会话 Token 统计等专属能力,是程序员与 AI 高效交互的轻量化开源神器。

二、功能特色

1. 多档位分层压缩模式

内置四种核心压缩档位,可按需一键切换,适配不同精简需求:

  • Lite 轻量模式:仅删除客套话术、过渡废话、重复表述,保留完整句式与专业表述,风格简洁正式,适合职场沟通、文档编写场景。

  • Full 标准模式(默认):精简英文冠词、冗余连词、碎片化修饰语句,还原经典原始人极简风格,编程日常使用首选。

  • Ultra 极致模式:电报体极简压缩,省略非必要词汇,用最短字符传递核心信息,极致节省 Token。

  • Wenyan 文言文模式:同步提供 Lite/Full/Ultra 三档,将现代技术内容转化为古文格式,压缩率拉满且极具特色,适合趣味使用与极致节流场景。

2. 专属编程快捷指令

内置多条一键指令,覆盖开发全流程高频场景:

  • /caveman-commit:自动生成50字符以内精简规范 Git 提交信息,告别冗长无意义备注。

  • /caveman-review:单行精简 PR 代码评审评语,直击代码问题核心,无多余话术。

  • /caveman-compress:智能压缩 AI 会话记忆文件,保留代码路径、函数逻辑等关键信息,精简无效上下文。

  • /caveman-stats:专属 Claude Code 统计能力,查看单次会话、终身累计Token 节省数量与压缩比例

3. 子代理与中间件支持

  • Cavecrew 子代理:配套子代理工具,为多智能体协作场景统一极简输出规则,整体 Token 消耗再降60%,有效延长大模型上下文窗口可用时长。

  • Caveman-shrink MCP 中间件:适配 MCP 服务架构,自动压缩服务描述字段,完整保留代码标识符、接口路径、参数逻辑,不影响业务调用。

4. 跨平台全生态适配

  • 兼容 macOS、Linux、WSL、Windows 全操作系统;

  • 原生支持 Claude Code、Cursor、Gemini CLI、Copilot 等30+ AI 编程工具;

  • 提供 Shell、PowerShell 一键安装脚本,支持插件市场手动添加,部署零门槛。

5. 核心优势特性

  • 高压缩率:平均输出文本压缩率65%,最高可达87%,配套工具可再压缩输入Token约46%;

  • 零信息损耗:仅删减冗余文本,代码、逻辑、专业术语、技术结论完全保留

  • 开源免费:基于 MIT 开源协议,可自由商用、二次开发、自定义改造;

  • 无配置依赖:开箱即用,无需复杂配置,一句指令即可切换模式、开关功能。

三、技术细节

1. 核心工作原理

Caveman 采用规则引擎+语义过滤双层架构实现文本压缩:

  1. 表层规则过滤:内置海量话术词库,自动匹配并删除礼貌客套、过渡语句、重复铺垫、冗余冠词、连词等无效文本;

  2. 语义层级保留:通过轻量语义解析,识别代码块、技术参数、逻辑结论、路径地址等核心关键信息,做强制保留,不做删减;

  3. 格式重构输出:按选定档位(Lite/Full/Ultra/Wenyan)重新规整文本句式,精简换行、无效标点,生成极简标准化内容。

2. 项目技术架构

  • 主体采用 Node.js 开发,适配 AI 插件生态通用标准,可无缝接入各类大模型客户端插件系统;

  • 采用模块化设计,压缩规则、指令系统、统计模块、中间件能力相互解耦,支持后续自定义扩展新档位、新风格;

  • 内置独立 Token 计算模块,精准统计输入输出字符消耗,实时生成节省比例数据。

3. 安装与部署技术逻辑

# macOS/Linux/WSL 一键安装底层逻辑
curl 拉取远程安装脚本 → 自动检测系统环境 → 配置全局命令 → 注册AI插件服务 → 完成环境适配

Windows 平台通过 PowerShell 远程脚本,自动适配系统权限、注册表配置与终端环境,无需手动配置环境变量。

4. 扩展能力设计

支持开发者自定义:

  • 新增自定义压缩规则词库;

  • 适配小众 AI 客户端接入;

  • 二次开发封装为独立 API 服务,集成到自研 AI 平台。

Caveman:开源AI文本压缩工具,高比例精简对话节省Token

四、应用场景

  1. AI 编程开发
    日常使用 Cursor、Claude Code 写代码、查 Bug、写算法逻辑,开启 Caveman 后,大模型回复无废话,一眼直达代码核心,节省阅读与梳理时间。

  2. Git 工程协作
    使用 /caveman-commit 快速生成规范精简提交日志,团队版本管理更整洁;通过 /caveman-review 精简代码评审意见,高效沟通问题。

  3. 大模型成本节流
    付费大模型按 Token 计费,高压缩率大幅减少会话字符消耗,直接降低 API 调用成本,适合个人开发者、小型技术团队长期使用。

  4. 长会话上下文优化
    通过 caveman-compress 压缩历史会话记忆,精简无效上下文,释放大模型上下文窗口空间,避免长会话卡顿、失忆问题。

  5. 技术文档与笔记整理
    将大模型生成的冗长技术文档、学习笔记,一键压缩为极简版本,保留核心知识点,便于归档与快速查阅。

  6. 多智能体协同工作
    借助 Cavecrew 子代理能力,多 AI 智能体协作开发时统一极简输出风格,整体会话更整洁、Token 消耗更低。

五、使用方法

1. 一键安装

macOS / Linux / WSL

curl -fsSL https://raw.githubusercontent.com/JuliusBrussee/caveman/main/install.sh | bash

Windows PowerShell

irm https://raw.githubusercontent.com/JuliusBrussee/caveman/main/install.ps1 | iex

2. 手动安装(Claude Code 为例)

# 插件市场添加并安装
claude plugin marketplace add JuliusBrussee/caveman && claude plugin install caveman@caveman

3. 基础激活与切换

  • 开启极简模式:输入 /caveman 或自然语言指令 talk like caveman

  • 切换压缩档位:

/caveman lite
/caveman full
/caveman ultra
/caveman wenyan
  • 关闭极简模式:输入 stop cavemannormal mode

4. 常用专属指令

# 生成精简Git提交备注
/caveman-commit

# 精简PR代码评审
/caveman-review

# 压缩会话记忆文件
/caveman-compress

# 查看Token节省统计
/caveman-stats

六、竞品对比

选取同类型 AI 文本精简、Token 优化工具做横向对比,直观体现 Caveman 差异化优势:

对比维度 Caveman AI Text Shrinker Token Safer AI
核心定位 AI编程专属极简压缩,原始人风格 通用型大模型文本精简 专注Token计费节流工具
适配场景 代码开发、PR评审、Git提交、AI编程助手 文案写作、日常对话、通用文本 仅API调用Token消耗优化
多档位模式 Lite/Full/Ultra/文言文4档 仅基础精简1种模式 无档位区分,固定压缩规则
编程专属指令 支持Git提交、PR评审、会话统计等专属指令 无编程定制指令 无开发场景专属能力
跨平台适配 全系统+30+AI编程客户端 仅网页端与通用大模型 仅API接口适配
开源协议 MIT开源,可免费商用二次开发 闭源工具,仅限在线使用 开源但仅限节流,无风格化输出
特色能力 子代理协同、MCP中间件、文言文压缩 基础文本去重、话术删减 仅字符压缩,保留句式原样

七、常见问题解答

Q:Caveman 压缩后会不会丢失代码和技术关键信息?

A:不会。项目采用规则+语义双层解析机制,会强制保留代码块、函数逻辑、接口路径、技术参数、错误日志等核心内容,仅删除客套、过渡、重复等无效文本,专业技术信息零损耗。

Q:支持国内本地大模型、私有化部署AI工具使用吗?

A:原生适配主流开源 AI 客户端,只要支持插件扩展、自定义指令的私有化大模型工具,均可手动接入使用,仅需简单配置指令即可生效。

Q:安装后没有生效,是什么原因?

A:大概率是终端环境变量未刷新、AI 插件未重启,可关闭当前 AI 客户端重新打开,或重新执行一遍安装脚本,系统会自动补全环境配置。

Q:文言文模式可以自定义文风吗?

A:官方默认提供三档文言文压缩规则,开源版本可自行修改项目内置词库与句式规则,自定义专属古文精简风格。

Q:使用Caveman会影响大模型的推理逻辑和回答准确性吗?

A:完全不影响。工具仅对最终输出文本做格式精简,不干预大模型底层推理、不修改思考逻辑,只做表层文本规整。

Q:能否在团队多人协作中统一开启极简风格?

A:可以。借助 Cavecrew 子代理功能,团队所有成员配置统一规则后,多智能体、多人员协作时可保持一致的极简输出风格,提升协作效率。

八、相关链接

九、总结

Caveman 是一款面向程序员与 AI 深度交互场景的开源原始人风格文本压缩工具,依托多档位分层压缩规则、编程专属快捷指令、全平台跨生态适配能力,在完全保留技术核心信息的基础上实现超高比例 Token 精简,既能够有效降低付费大模型的使用成本、提升 AI 对话与代码开发的阅读效率,又适配 Git 协作、代码评审、长会话上下文优化等各类技术高频场景,MIT 开源协议赋予其免费商用与二次开发的自由度,轻量化部署、开箱即用的特性使其成为开发者日常 AI 编程交互中不可或缺的极简效率工具。

打赏
THE END
作者头像
AI工具集
工具不孤岛,AI集大成——这里有你要的一切智能解法