Caveman：开源AI文本压缩工具，高比例精简对话节省Token

原创发布日期：2026-05-11

131

一、Caveman 是什么

Caveman 是一款开源的AI 会话文本压缩工具，专为 AI 编程助手、大模型对话场景设计。项目核心设计理念源自“原始人极简沟通逻辑”：剔除大模型回复中冗余客套、修饰性语句、重复铺垫、无效冠词与废话文本，在100%保留核心技术信息、代码逻辑、业务要点不变的前提下，极致压缩输出文本体积。

该项目原生适配 Claude Code、Cursor、Gemini CLI、GitHub Copilot 等三十余款主流 AI 编程智能体与大模型客户端，不改变大模型推理能力、不篡改专业内容，仅对输入输出文本进行轻量化规整压缩，实现减少 Token 消耗、提升响应速度、降低使用成本、精简阅读体验四大核心价值。

不同于普通文本精简工具，Caveman 专为代码开发、工程协作、PR 代码评审、Git 提交备注、AI 长会话记忆压缩等技术场景深度定制，支持多档位压缩模式、文言文压缩、子代理协同压缩、会话 Token 统计等专属能力，是程序员与 AI 高效交互的轻量化开源神器。

二、功能特色

1. 多档位分层压缩模式

内置四种核心压缩档位，可按需一键切换，适配不同精简需求：

Lite 轻量模式：仅删除客套话术、过渡废话、重复表述，保留完整句式与专业表述，风格简洁正式，适合职场沟通、文档编写场景。
Full 标准模式（默认）：精简英文冠词、冗余连词、碎片化修饰语句，还原经典原始人极简风格，编程日常使用首选。
Ultra 极致模式：电报体极简压缩，省略非必要词汇，用最短字符传递核心信息，极致节省 Token。
Wenyan 文言文模式：同步提供 Lite/Full/Ultra 三档，将现代技术内容转化为古文格式，压缩率拉满且极具特色，适合趣味使用与极致节流场景。

2. 专属编程快捷指令

内置多条一键指令，覆盖开发全流程高频场景：

/caveman-commit：自动生成50字符以内精简规范 Git 提交信息，告别冗长无意义备注。
/caveman-review：单行精简 PR 代码评审评语，直击代码问题核心，无多余话术。
/caveman-compress：智能压缩 AI 会话记忆文件，保留代码路径、函数逻辑等关键信息，精简无效上下文。
/caveman-stats：专属 Claude Code 统计能力，查看单次会话、终身累计Token 节省数量与压缩比例。

3. 子代理与中间件支持

Cavecrew 子代理：配套子代理工具，为多智能体协作场景统一极简输出规则，整体 Token 消耗再降60%，有效延长大模型上下文窗口可用时长。
Caveman-shrink MCP 中间件：适配 MCP 服务架构，自动压缩服务描述字段，完整保留代码标识符、接口路径、参数逻辑，不影响业务调用。

4. 跨平台全生态适配

兼容 macOS、Linux、WSL、Windows 全操作系统；
原生支持 Claude Code、Cursor、Gemini CLI、Copilot 等30+ AI 编程工具；
提供 Shell、PowerShell 一键安装脚本，支持插件市场手动添加，部署零门槛。

5. 核心优势特性

高压缩率：平均输出文本压缩率65%，最高可达87%，配套工具可再压缩输入Token约46%；
零信息损耗：仅删减冗余文本，代码、逻辑、专业术语、技术结论完全保留；
开源免费：基于 MIT 开源协议，可自由商用、二次开发、自定义改造；
无配置依赖：开箱即用，无需复杂配置，一句指令即可切换模式、开关功能。

三、技术细节

1. 核心工作原理

Caveman 采用规则引擎+语义过滤双层架构实现文本压缩：

表层规则过滤：内置海量话术词库，自动匹配并删除礼貌客套、过渡语句、重复铺垫、冗余冠词、连词等无效文本；
语义层级保留：通过轻量语义解析，识别代码块、技术参数、逻辑结论、路径地址等核心关键信息，做强制保留，不做删减；
格式重构输出：按选定档位（Lite/Full/Ultra/Wenyan）重新规整文本句式，精简换行、无效标点，生成极简标准化内容。

2. 项目技术架构

主体采用 Node.js 开发，适配 AI 插件生态通用标准，可无缝接入各类大模型客户端插件系统；
采用模块化设计，压缩规则、指令系统、统计模块、中间件能力相互解耦，支持后续自定义扩展新档位、新风格；
内置独立 Token 计算模块，精准统计输入输出字符消耗，实时生成节省比例数据。

3. 安装与部署技术逻辑

# macOS/Linux/WSL 一键安装底层逻辑
curl 拉取远程安装脚本 → 自动检测系统环境 → 配置全局命令 → 注册AI插件服务 → 完成环境适配

Windows 平台通过 PowerShell 远程脚本，自动适配系统权限、注册表配置与终端环境，无需手动配置环境变量。

4. 扩展能力设计

支持开发者自定义：

新增自定义压缩规则词库；
适配小众 AI 客户端接入；
二次开发封装为独立 API 服务，集成到自研 AI 平台。

Caveman：开源AI文本压缩工具，高比例精简对话节省Token

四、应用场景

AI 编程开发
日常使用 Cursor、Claude Code 写代码、查 Bug、写算法逻辑，开启 Caveman 后，大模型回复无废话，一眼直达代码核心，节省阅读与梳理时间。
Git 工程协作
使用 /caveman-commit 快速生成规范精简提交日志，团队版本管理更整洁；通过 /caveman-review 精简代码评审意见，高效沟通问题。
大模型成本节流
付费大模型按 Token 计费，高压缩率大幅减少会话字符消耗，直接降低 API 调用成本，适合个人开发者、小型技术团队长期使用。
长会话上下文优化
通过 caveman-compress 压缩历史会话记忆，精简无效上下文，释放大模型上下文窗口空间，避免长会话卡顿、失忆问题。
技术文档与笔记整理
将大模型生成的冗长技术文档、学习笔记，一键压缩为极简版本，保留核心知识点，便于归档与快速查阅。
多智能体协同工作
借助 Cavecrew 子代理能力，多 AI 智能体协作开发时统一极简输出风格，整体会话更整洁、Token 消耗更低。

五、使用方法

1. 一键安装

macOS / Linux / WSL

curl -fsSL https://raw.githubusercontent.com/JuliusBrussee/caveman/main/install.sh | bash

Windows PowerShell

irm https://raw.githubusercontent.com/JuliusBrussee/caveman/main/install.ps1 | iex

2. 手动安装（Claude Code 为例）

# 插件市场添加并安装
claude plugin marketplace add JuliusBrussee/caveman && claude plugin install caveman@caveman

3. 基础激活与切换

开启极简模式：输入 /caveman 或自然语言指令 talk like caveman；
切换压缩档位：

/caveman lite
/caveman full
/caveman ultra
/caveman wenyan

关闭极简模式：输入 stop caveman 或 normal mode。

4. 常用专属指令

# 生成精简Git提交备注
/caveman-commit

# 精简PR代码评审
/caveman-review

# 压缩会话记忆文件
/caveman-compress

# 查看Token节省统计
/caveman-stats

六、竞品对比

选取同类型 AI 文本精简、Token 优化工具做横向对比，直观体现 Caveman 差异化优势：

对比维度	Caveman	AI Text Shrinker	Token Safer AI
核心定位	AI编程专属极简压缩，原始人风格	通用型大模型文本精简	专注Token计费节流工具
适配场景	代码开发、PR评审、Git提交、AI编程助手	文案写作、日常对话、通用文本	仅API调用Token消耗优化
多档位模式	Lite/Full/Ultra/文言文4档	仅基础精简1种模式	无档位区分，固定压缩规则
编程专属指令	支持Git提交、PR评审、会话统计等专属指令	无编程定制指令	无开发场景专属能力
跨平台适配	全系统+30+AI编程客户端	仅网页端与通用大模型	仅API接口适配
开源协议	MIT开源，可免费商用二次开发	闭源工具，仅限在线使用	开源但仅限节流，无风格化输出
特色能力	子代理协同、MCP中间件、文言文压缩	基础文本去重、话术删减	仅字符压缩，保留句式原样

七、常见问题解答

Q：Caveman 压缩后会不会丢失代码和技术关键信息？

A：不会。项目采用规则+语义双层解析机制，会强制保留代码块、函数逻辑、接口路径、技术参数、错误日志等核心内容，仅删除客套、过渡、重复等无效文本，专业技术信息零损耗。

Q：支持国内本地大模型、私有化部署AI工具使用吗？

A：原生适配主流开源 AI 客户端，只要支持插件扩展、自定义指令的私有化大模型工具，均可手动接入使用，仅需简单配置指令即可生效。

Q：安装后没有生效，是什么原因？

A：大概率是终端环境变量未刷新、AI 插件未重启，可关闭当前 AI 客户端重新打开，或重新执行一遍安装脚本，系统会自动补全环境配置。

Q：文言文模式可以自定义文风吗？

A：官方默认提供三档文言文压缩规则，开源版本可自行修改项目内置词库与句式规则，自定义专属古文精简风格。

Q：使用Caveman会影响大模型的推理逻辑和回答准确性吗？

A：完全不影响。工具仅对最终输出文本做格式精简，不干预大模型底层推理、不修改思考逻辑，只做表层文本规整。

Q：能否在团队多人协作中统一开启极简风格？

A：可以。借助 Cavecrew 子代理功能，团队所有成员配置统一规则后，多智能体、多人员协作时可保持一致的极简输出风格，提升协作效率。

八、相关链接

项目 GitHub 开源地址：https://github.com/JuliusBrussee/caveman

九、总结

Caveman 是一款面向程序员与 AI 深度交互场景的开源原始人风格文本压缩工具，依托多档位分层压缩规则、编程专属快捷指令、全平台跨生态适配能力，在完全保留技术核心信息的基础上实现超高比例 Token 精简，既能够有效降低付费大模型的使用成本、提升 AI 对话与代码开发的阅读效率，又适配 Git 协作、代码评审、长会话上下文优化等各类技术高频场景，MIT 开源协议赋予其免费商用与二次开发的自由度，轻量化部署、开箱即用的特性使其成为开发者日常 AI 编程交互中不可或缺的极简效率工具。