AgentMemory:开源AI编程智能体持久记忆系统,解决跨会话上下文丢失难题
一、AgentMemory是什么
AgentMemory 是一款专为AI编程助手打造的开源持久记忆系统,核心解决AI智能体“跨会话失忆”痛点——每次重启会话后,无需重复解释项目架构、技术选型、代码决策与个人偏好,让AI编程助手拥有“长期记忆”。
该项目由开发者 rohitg00 于2026年5月开源,基于 Rust 编写的 iii-engine 构建,采用客户端-服务器架构,以本地 SQLite 为默认存储,无外部数据库依赖,支持私有化部署。作为独立记忆层,它不替代现有AI编程工具,而是通过 MCP 协议、Hooks 机制或 REST API 无缝接入 Claude Code、Cursor、Gemini CLI、Codex CLI、OpenCode 等主流工具,实现多智能体共享同一份项目记忆。
官方数据显示,AgentMemory 在 LongMemEval-S(ICLR 2025)基准测试中达到95.2%的R@5召回率,可将年度 token 消耗从1950万压缩至17万,大幅降低使用成本。
二、功能特色
1. 全自动记忆捕获
通过12个生命周期钩子(Hook)自动记录AI智能体全流程操作,无需手动输入记忆指令。
SessionStart:捕获项目路径、会话ID
UserPromptSubmit:记录用户提示(隐私过滤后)
PreToolUse:抓取文件访问模式与上下文
PostToolUse:留存工具名称、输入输出结果
PostToolUseFailure:记录错误上下文,避免重复踩坑
2. 四层结构化记忆模型
将记忆分层存储,从原始数据到核心决策逐步精炼,兼顾完整性与检索效率。
Working(工作记忆):存储工具调用原始观察数据
Episodic(情景记忆):生成会话总结,记录“发生过什么”
Semantic(语义记忆):提取项目事实、技术选型与关键约束
Procedural(程序记忆):沉淀流程规范、决策模式与最佳实践
3. 混合检索精准召回
采用BM25关键词匹配+向量语义检索+知识图谱关联三路融合检索,通过RRF(Reciprocal Rank Fusion)算法排序,兼顾关键词精准度与语义关联性。
BM25:命中文件名、函数名等强关键词记忆
向量搜索:匹配“数据库性能优化”等语义相近内容
知识图谱:通过实体关系链路(如prisma→database→performance)召回关联记忆
4. 多智能体记忆共享
不绑定单一AI工具,Claude Code记录的项目决策、Cursor生成的代码规范,可被 Codex CLI、OpenCode 等其他智能体检索复用,避免多工具切换时重复同步项目信息。
5. 隐私安全与记忆治理
内置完善的隐私保护与记忆管理能力,平衡记忆留存与数据安全。
隐私过滤:自动脱敏API密钥、密码、身份证号等敏感信息
审计追踪:记录所有记忆操作日志,支持溯源
记忆控制:提供
/remember/recall/forget指令,支持手动增删记忆自动遗忘:可设置记忆留存周期,自动清理过期无效记忆
6. 轻量部署与可视化管理
零依赖部署:基于iii-engine构建,单
npx命令即可启动,无需额外安装数据库本地可视化界面:内置Viewer面板,支持查看记忆列表、会话回放、检索结果分析
多接入方式:支持MCP协议、REST API、Hooks插件,适配不同使用场景

三、技术细节
1. 核心架构:iii-engine一体化驱动
AgentMemory 核心依赖 iii-engine——Rust编写的通用运行时,内置HTTP触发器、KV存储、内存向量索引、WebSocket流与OpenTelemetry可观测性,替代传统方案中Express+SQLite+pgvector+Socket.io的复杂拼装。
优势:单命令启动、进程内向量索引(检索延迟P50<20ms)、内置可观测性
劣势:依赖特定版本iii-engine(当前v0.11.2),Windows需额外配置
2. 存储与嵌入方案
(1)存储引擎
默认采用SQLite本地存储,轻量无依赖,支持数据持久化与快速读写;同时支持自定义存储路径,方便项目迁移与备份。
(2)向量嵌入
默认使用 all-MiniLM-L6-v2 轻量嵌入模型,平衡速度与精度;支持替换为BGE、Sentence-BERT等模型,适配不同语言与场景需求。
3. 记忆处理流程
完整闭环:捕获→去重→过滤→压缩→存储→检索→注入。
捕获:Hooks监听智能体操作,生成原始记忆数据
去重:SHA-256哈希校验,自动过滤重复记录
过滤:隐私规则引擎脱敏敏感信息
压缩:LLM自动摘要,将长文本压缩为结构化短句
存储:按四层记忆模型分类,存入SQLite与向量索引
检索:会话启动时,混合检索召回相关记忆
注入:自动将记忆注入智能体上下文,无需手动粘贴
4. 核心技术参数
| 维度 | 技术参数 |
|---|---|
| 开发语言 | TypeScript(上层)+ Rust(iii-engine底层) |
| 支持Node.js版本 | ≥20.0 |
| 存储容量 | 无硬性限制,单项目建议≤10万条记忆 |
| 检索延迟 | P50<20ms,P95<50ms |
| 召回率 | LongMemEval-S基准95.2%(R@5) |
| 许可证 | Apache-2.0(开源免费,可商用) |
四、应用场景
1. 个人开发者长期项目开发
适合独立开发者使用Claude Code、Cursor等工具进行长期项目迭代,无需每次会话重复说明技术栈(如“用React+TypeScript,状态管理用Zustand”)、架构设计(如“微前端拆分,独立部署”)与避坑经验(如“避免使用某库,存在兼容性问题”),大幅提升开发效率。
2. 团队协作开发
团队成员可共享同一AgentMemory服务,沉淀团队统一的代码规范、技术决策与最佳实践。新成员接入时,AI智能体可直接召回团队历史记忆,快速熟悉项目,降低上手成本。
3. 多AI工具协同工作
同时使用多款AI编程工具(如Cursor写代码、Gemini CLI查文档、Codex CLI调试)的用户,可通过AgentMemory实现记忆互通,避免在不同工具间重复同步项目信息,保持开发逻辑一致性。
4. 私有化部署与敏感项目开发
金融、政务等敏感领域项目,需严格控制数据隐私。AgentMemory支持本地私有化部署,所有记忆数据存储在本地SQLite,不上传云端,满足数据安全合规要求。
5. 学习与实验场景
编程学习者可通过AgentMemory记录学习过程中的代码练习、错误日志与知识点总结,后续会话中AI可基于历史记忆针对性辅导,帮助巩固知识,避免重复犯错。
五、使用方法
1. 环境准备
确保Node.js版本≥20.0,推荐使用npx直接运行,无需全局安装。
2. 快速安装与启动
# 直接启动AgentMemory服务(默认端口3000) npx @agentmemory/agentmemory # 指定端口启动 npx @agentmemory/agentmemory --port 3001 # 查看帮助 npx @agentmemory/agentmemory --help
3. 接入AI编程工具
(1)接入Claude Code
# 连接Claude Code agentmemory connect claude-code
(2)接入Cursor
打开Cursor设置→扩展→启用MCP支持
输入AgentMemory服务地址:
http://localhost:3000/mcp保存后重启Cursor,自动同步记忆
(3)接入Gemini CLI
# 连接Gemini CLI agentmemory connect gemini-cli
4. 常用记忆指令
在AI工具对话中直接输入以下指令,管理记忆:
/remember [内容]:手动添加记忆(如/remember 项目使用JWT认证,密钥存储在环境变量)/recall [关键词]:检索相关记忆(如/recall 数据库选型)/forget [关键词]:删除指定记忆(如/forget 旧版API设计)/list:查看当前项目所有记忆
5. 可视化界面使用
启动服务后,浏览器访问 http://localhost:3000 打开Viewer面板:
记忆管理:查看、搜索、删除、导出记忆
会话回放:查看历史会话的完整操作记录
检索测试:输入关键词,测试混合检索效果

六、竞品对比
选取当前主流AI智能体记忆系统 Mem0、Zep AI 与 AgentMemory 从核心维度对比:
| 对比维度 | AgentMemory | Mem0 | Zep AI |
|---|---|---|---|
| 核心定位 | AI编程专用持久记忆 | 通用型记忆即服务 | 时序感知记忆服务 |
| 部署方式 | 本地私有化部署(零依赖) | 云端SaaS为主,支持自部署 | 云端SaaS,自部署复杂 |
| 检索策略 | BM25+向量+知识图谱(三路融合) | 向量+图混合检索 | 情节图谱+时序检索 |
| 编程工具适配 | 原生支持Claude Code、Cursor等 | 需自定义集成,适配一般 | 适配有限,侧重对话场景 |
| 记忆分层 | 四层结构化模型(Working→Procedural) | 扁平KV存储,无明确分层 | 三层记忆(短期/中期/长期) |
| 隐私控制 | 本地存储+隐私过滤+自动遗忘 | 云端加密,自定义规则有限 | 合规性强,支持数据脱敏 |
| 成本 | 开源免费,无使用限制 | 免费额度有限,付费阶梯定价 | 按API调用次数计费 |
| 召回率(LongMemEval-S) | 95.2%(R@5) | 65%-70%(R@5) | 78%-82%(R@5) |
| 上手难度 | 极简(单命令启动) | 简单(一行代码集成) | 中等(需配置时序规则) |
结论:AgentMemory 专为AI编程场景优化,在工具适配、检索精度、私有化部署与成本方面优势显著;Mem0 胜在通用性与快速集成;Zep AI 更适合时序敏感的对话场景。
七、常见问题解答
AgentMemory会替代我现有的AI编程工具吗?
不会。AgentMemory是独立的记忆层,不替代Claude Code、Cursor等工具,而是通过接入方式为现有工具补充持久记忆能力,原有工具功能完全保留。
我的记忆数据安全吗?会上传到云端吗?
安全。AgentMemory默认本地部署,所有记忆数据存储在本地SQLite数据库,不上传任何云端服务器;同时内置隐私过滤功能,自动脱敏敏感信息,支持手动删除记忆。
支持Windows系统吗?
支持,但Windows需额外配置:安装Visual C++ Build Tools,确保Node.js环境正常;推荐使用WSL2(Linux子系统)运行,避免兼容性问题。
接入后AI工具没召回记忆,怎么办?
排查步骤:1. 确认AgentMemory服务正常运行(访问http://localhost:3000可打开面板);2. 检查AI工具是否成功接入(MCP地址正确、已重启工具);3. 确认项目有历史记忆(可在面板查看记忆列表);4. 检索关键词尽量精准,避免过于宽泛。
可以同时接入多个AI工具吗?
可以。AgentMemory支持多工具同时接入,Claude Code、Cursor、Gemini CLI可连接同一服务,共享同一份项目记忆,实现多工具记忆互通。
记忆会无限存储吗?需要手动清理吗?
不会无限存储。支持设置记忆留存周期(默认永久),可配置自动遗忘规则,定期清理过期记忆;也可通过/forget指令或可视化面板手动删除无用记忆。
八、相关链接
九、总结
AgentMemory 是一款聚焦AI编程场景的开源持久记忆系统,以iii-engine为核心架构,通过全自动捕获、四层结构化存储与混合检索技术,高效解决AI智能体跨会话上下文丢失问题。它具备轻量部署、隐私安全、多工具适配、记忆共享等核心优势,适配个人开发、团队协作、私有化部署等多元场景,相比通用型记忆产品在编程领域表现更优,为AI编程助手提供稳定、高效、安全的长期记忆能力,大幅提升开发效率与体验。
版权及免责申明:本文由@人工智能研究所原创发布。该文章观点仅代表作者本人,不代表本站立场。本站不承担任何相关法律责任。
如若转载,请注明出处:https://www.aipuzi.cn/ai-news/agentmemory.html

