Caveman:开源AI文本压缩工具,高比例精简对话节省Token
一、Caveman 是什么
Caveman 是一款开源的AI 会话文本压缩工具,专为 AI 编程助手、大模型对话场景设计。项目核心设计理念源自“原始人极简沟通逻辑”:剔除大模型回复中冗余客套、修饰性语句、重复铺垫、无效冠词与废话文本,在100%保留核心技术信息、代码逻辑、业务要点不变的前提下,极致压缩输出文本体积。
该项目原生适配 Claude Code、Cursor、Gemini CLI、GitHub Copilot 等三十余款主流 AI 编程智能体与大模型客户端,不改变大模型推理能力、不篡改专业内容,仅对输入输出文本进行轻量化规整压缩,实现减少 Token 消耗、提升响应速度、降低使用成本、精简阅读体验四大核心价值。
不同于普通文本精简工具,Caveman 专为代码开发、工程协作、PR 代码评审、Git 提交备注、AI 长会话记忆压缩等技术场景深度定制,支持多档位压缩模式、文言文压缩、子代理协同压缩、会话 Token 统计等专属能力,是程序员与 AI 高效交互的轻量化开源神器。
二、功能特色
1. 多档位分层压缩模式
内置四种核心压缩档位,可按需一键切换,适配不同精简需求:
Lite 轻量模式:仅删除客套话术、过渡废话、重复表述,保留完整句式与专业表述,风格简洁正式,适合职场沟通、文档编写场景。
Full 标准模式(默认):精简英文冠词、冗余连词、碎片化修饰语句,还原经典原始人极简风格,编程日常使用首选。
Ultra 极致模式:电报体极简压缩,省略非必要词汇,用最短字符传递核心信息,极致节省 Token。
Wenyan 文言文模式:同步提供 Lite/Full/Ultra 三档,将现代技术内容转化为古文格式,压缩率拉满且极具特色,适合趣味使用与极致节流场景。
2. 专属编程快捷指令
内置多条一键指令,覆盖开发全流程高频场景:
/caveman-commit:自动生成50字符以内精简规范 Git 提交信息,告别冗长无意义备注。/caveman-review:单行精简 PR 代码评审评语,直击代码问题核心,无多余话术。/caveman-compress:智能压缩 AI 会话记忆文件,保留代码路径、函数逻辑等关键信息,精简无效上下文。/caveman-stats:专属 Claude Code 统计能力,查看单次会话、终身累计Token 节省数量与压缩比例。
3. 子代理与中间件支持
Cavecrew 子代理:配套子代理工具,为多智能体协作场景统一极简输出规则,整体 Token 消耗再降60%,有效延长大模型上下文窗口可用时长。
Caveman-shrink MCP 中间件:适配 MCP 服务架构,自动压缩服务描述字段,完整保留代码标识符、接口路径、参数逻辑,不影响业务调用。
4. 跨平台全生态适配
兼容 macOS、Linux、WSL、Windows 全操作系统;
原生支持 Claude Code、Cursor、Gemini CLI、Copilot 等30+ AI 编程工具;
提供 Shell、PowerShell 一键安装脚本,支持插件市场手动添加,部署零门槛。
5. 核心优势特性
高压缩率:平均输出文本压缩率65%,最高可达87%,配套工具可再压缩输入Token约46%;
零信息损耗:仅删减冗余文本,代码、逻辑、专业术语、技术结论完全保留;
开源免费:基于 MIT 开源协议,可自由商用、二次开发、自定义改造;
无配置依赖:开箱即用,无需复杂配置,一句指令即可切换模式、开关功能。
三、技术细节
1. 核心工作原理
Caveman 采用规则引擎+语义过滤双层架构实现文本压缩:
表层规则过滤:内置海量话术词库,自动匹配并删除礼貌客套、过渡语句、重复铺垫、冗余冠词、连词等无效文本;
语义层级保留:通过轻量语义解析,识别代码块、技术参数、逻辑结论、路径地址等核心关键信息,做强制保留,不做删减;
格式重构输出:按选定档位(Lite/Full/Ultra/Wenyan)重新规整文本句式,精简换行、无效标点,生成极简标准化内容。
2. 项目技术架构
主体采用 Node.js 开发,适配 AI 插件生态通用标准,可无缝接入各类大模型客户端插件系统;
采用模块化设计,压缩规则、指令系统、统计模块、中间件能力相互解耦,支持后续自定义扩展新档位、新风格;
内置独立 Token 计算模块,精准统计输入输出字符消耗,实时生成节省比例数据。
3. 安装与部署技术逻辑
# macOS/Linux/WSL 一键安装底层逻辑 curl 拉取远程安装脚本 → 自动检测系统环境 → 配置全局命令 → 注册AI插件服务 → 完成环境适配
Windows 平台通过 PowerShell 远程脚本,自动适配系统权限、注册表配置与终端环境,无需手动配置环境变量。
4. 扩展能力设计
支持开发者自定义:
新增自定义压缩规则词库;
适配小众 AI 客户端接入;
二次开发封装为独立 API 服务,集成到自研 AI 平台。

四、应用场景
AI 编程开发
日常使用 Cursor、Claude Code 写代码、查 Bug、写算法逻辑,开启 Caveman 后,大模型回复无废话,一眼直达代码核心,节省阅读与梳理时间。Git 工程协作
使用/caveman-commit快速生成规范精简提交日志,团队版本管理更整洁;通过/caveman-review精简代码评审意见,高效沟通问题。大模型成本节流
付费大模型按 Token 计费,高压缩率大幅减少会话字符消耗,直接降低 API 调用成本,适合个人开发者、小型技术团队长期使用。长会话上下文优化
通过caveman-compress压缩历史会话记忆,精简无效上下文,释放大模型上下文窗口空间,避免长会话卡顿、失忆问题。技术文档与笔记整理
将大模型生成的冗长技术文档、学习笔记,一键压缩为极简版本,保留核心知识点,便于归档与快速查阅。多智能体协同工作
借助 Cavecrew 子代理能力,多 AI 智能体协作开发时统一极简输出风格,整体会话更整洁、Token 消耗更低。
五、使用方法
1. 一键安装
macOS / Linux / WSL
curl -fsSL https://raw.githubusercontent.com/JuliusBrussee/caveman/main/install.sh | bash
Windows PowerShell
irm https://raw.githubusercontent.com/JuliusBrussee/caveman/main/install.ps1 | iex
2. 手动安装(Claude Code 为例)
# 插件市场添加并安装 claude plugin marketplace add JuliusBrussee/caveman && claude plugin install caveman@caveman
3. 基础激活与切换
开启极简模式:输入
/caveman或自然语言指令talk like caveman;切换压缩档位:
/caveman lite /caveman full /caveman ultra /caveman wenyan
关闭极简模式:输入
stop caveman或normal mode。
4. 常用专属指令
# 生成精简Git提交备注 /caveman-commit # 精简PR代码评审 /caveman-review # 压缩会话记忆文件 /caveman-compress # 查看Token节省统计 /caveman-stats
六、竞品对比
选取同类型 AI 文本精简、Token 优化工具做横向对比,直观体现 Caveman 差异化优势:
| 对比维度 | Caveman | AI Text Shrinker | Token Safer AI |
|---|---|---|---|
| 核心定位 | AI编程专属极简压缩,原始人风格 | 通用型大模型文本精简 | 专注Token计费节流工具 |
| 适配场景 | 代码开发、PR评审、Git提交、AI编程助手 | 文案写作、日常对话、通用文本 | 仅API调用Token消耗优化 |
| 多档位模式 | Lite/Full/Ultra/文言文4档 | 仅基础精简1种模式 | 无档位区分,固定压缩规则 |
| 编程专属指令 | 支持Git提交、PR评审、会话统计等专属指令 | 无编程定制指令 | 无开发场景专属能力 |
| 跨平台适配 | 全系统+30+AI编程客户端 | 仅网页端与通用大模型 | 仅API接口适配 |
| 开源协议 | MIT开源,可免费商用二次开发 | 闭源工具,仅限在线使用 | 开源但仅限节流,无风格化输出 |
| 特色能力 | 子代理协同、MCP中间件、文言文压缩 | 基础文本去重、话术删减 | 仅字符压缩,保留句式原样 |
七、常见问题解答
Q:Caveman 压缩后会不会丢失代码和技术关键信息?
A:不会。项目采用规则+语义双层解析机制,会强制保留代码块、函数逻辑、接口路径、技术参数、错误日志等核心内容,仅删除客套、过渡、重复等无效文本,专业技术信息零损耗。
Q:支持国内本地大模型、私有化部署AI工具使用吗?
A:原生适配主流开源 AI 客户端,只要支持插件扩展、自定义指令的私有化大模型工具,均可手动接入使用,仅需简单配置指令即可生效。
Q:安装后没有生效,是什么原因?
A:大概率是终端环境变量未刷新、AI 插件未重启,可关闭当前 AI 客户端重新打开,或重新执行一遍安装脚本,系统会自动补全环境配置。
Q:文言文模式可以自定义文风吗?
A:官方默认提供三档文言文压缩规则,开源版本可自行修改项目内置词库与句式规则,自定义专属古文精简风格。
Q:使用Caveman会影响大模型的推理逻辑和回答准确性吗?
A:完全不影响。工具仅对最终输出文本做格式精简,不干预大模型底层推理、不修改思考逻辑,只做表层文本规整。
Q:能否在团队多人协作中统一开启极简风格?
A:可以。借助 Cavecrew 子代理功能,团队所有成员配置统一规则后,多智能体、多人员协作时可保持一致的极简输出风格,提升协作效率。
八、相关链接
项目 GitHub 开源地址:https://github.com/JuliusBrussee/caveman
九、总结
Caveman 是一款面向程序员与 AI 深度交互场景的开源原始人风格文本压缩工具,依托多档位分层压缩规则、编程专属快捷指令、全平台跨生态适配能力,在完全保留技术核心信息的基础上实现超高比例 Token 精简,既能够有效降低付费大模型的使用成本、提升 AI 对话与代码开发的阅读效率,又适配 Git 协作、代码评审、长会话上下文优化等各类技术高频场景,MIT 开源协议赋予其免费商用与二次开发的自由度,轻量化部署、开箱即用的特性使其成为开发者日常 AI 编程交互中不可或缺的极简效率工具。
版权及免责申明:本文由@AI工具集原创发布。该文章观点仅代表作者本人,不代表本站立场。本站不承担任何相关法律责任。
如若转载,请注明出处:https://www.aipuzi.cn/ai-news/caveman.html

