LifeSim:复旦大学开源的长周期用户生活模拟器,AI助手个性化能力权威评测框架
一、LifeSim是什么
LifeSim是一款面向个性化AI助手长周期能力评估的开源用户生活仿真系统,由复旦大学数据科学学院团队研发,核心定位是填补现有大模型评测与真实用户生活场景脱节的空白。
传统AI助手评测多聚焦短对话、单轮任务,无法模拟用户在 days/weeks/months 级别的长期行为演化、认知变化与持续交互需求。LifeSim通过BDI认知模型+物理环境建模,生成高保真的用户生活轨迹、事件序列与意图驱动的交互行为,并基于此构建标准化评测基准LifeSim-Eval,实现对AI助手个性化理解、长期记忆、持续服务能力的量化评估。
项目完全开源,基于Python开发,模块化架构设计,支持本地大模型与云API接入,提供开箱即用的数据集、Web演示界面与全流程运行脚本,既可用于学术实验,也能直接落地到企业AI助手的研发测试环节。

二、功能特色
双场景仿真能力
支持单会话短周期与长周期人生轨迹两种仿真模式,覆盖单次问答到持续数月的生活交互全场景,完整还原用户行为连贯性。BDI认知驱动建模
以信念-愿望-意图模型为核心,模拟用户真实认知逻辑:信念为用户知识与状态,愿望为潜在目标,意图为最终执行的行为决策,让交互更贴近人类决策路径。真实物理环境约束
基于真实用户移动轨迹数据构建时空环境,融入时间、地点、天气、城市节律等要素,避免仿真行为脱离现实逻辑。LifeSim-Eval标准化评测
提供多维度量化指标,可评估助手的个性化适配度、长期记忆能力、意图理解准确率、服务连贯性等,输出可对比的评测报告。灵活模型接入方式
同时支持本地vLLM部署(Qwen、Llama3等开源大模型)与云API调用(OpenAI、DeepSeek、Claude等),兼容主流嵌入模型用于记忆检索。完整可视化与工具链
内置Web Demo界面,可直观查看仿真流程与交互日志;提供多进程运行脚本、数据预处理工具、配置模板,降低使用门槛。开箱即用的数据集
内置用户画像、事件序列、语言模板等数据集,支持自定义扩展,无需从零构建仿真数据。
三、技术细节
1. 整体架构
LifeSim采用分层模块化设计,核心分为四大模块:
认知引擎:BDI模型实现,管理用户信念、愿望、意图的生成与更新
事件引擎:基于时空环境生成生活事件,驱动用户轨迹演化
交互引擎:模拟用户与AI助手的多轮对话,采集交互数据
评估引擎:LifeSim-Eval指标计算,输出评测结果
2. 核心技术原理
BDI认知模型
信念:用户的个人信息、偏好、历史记忆、环境认知等状态集合
愿望:用户在不同场景下的潜在需求与目标集合
意图:结合信念与环境筛选后的执行目标,直接驱动交互行为
时空环境建模
基于Foursquare真实移动数据,构建城市-区域-地点三级空间结构,结合时间节律生成通勤、居家、社交等真实场景,事件触发符合现实概率分布。
模型对接层
本地推理:基于vLLM实现高吞吐大模型推理,支持多卡并行
云API:兼容OpenAI规范接口,一键接入商用模型
记忆检索:使用ChromaDB+ sentence-transformers嵌入模型,实现长期记忆高效召回
3. 仓库核心结构
lifesim/ ├── requirements.txt # 项目依赖 ├── data/ # 用户画像、事件、模板数据 ├── demo/ # Web演示前端与后端 ├── src/ │ ├── agents/ # 用户/助手智能体 │ ├── engine/ # 仿真核心引擎 │ ├── evaluation/ # LifeSim-Eval评测 │ ├── models/ # 模型适配层 │ └── main_mp.py # 多进程运行入口
4. 运行性能
支持多进程并行仿真,单节点可同时运行数十个用户仿真任务;长周期仿真可稳定运行数天,内存与CPU占用可控,适配常规科研服务器配置。
四、应用场景
AI助手产品研发
测试大模型在长期对话中的记忆保持、偏好学习、持续服务能力,定位产品短板,指导迭代优化。学术研究实验
为个性化大模型、用户建模、智能体仿真等方向提供标准化实验平台,生成可复现的实验数据。大模型评测基准建设
作为长周期评测补充方案,完善现有评测体系,更全面衡量模型真实落地能力。教育与教学实践
用于人工智能、人机交互课程的实验教学,帮助理解用户建模与仿真系统原理。智能产品场景验证
验证智能家居、车载助手、办公助理等产品在长期使用中的交互体验与功能稳定性。
五、使用方法
1. 环境准备
# 创建conda环境 conda create -n lifesim python=3.9 conda activate lifesim # 安装依赖 pip install -r requirements.txt
2. 数据准备
项目内置data目录包含完整数据集,包含:
用户画像数据(users.jsonl)
生活事件数据(events.jsonl)
交互语言模板(language_templates.json)
支持自定义修改用户属性、事件类型与对话模板。
3. 模型配置
复制配置模板并修改:
cp demo/config_template.yaml demo/config.yaml
在config.yaml中设置模型类型(本地vLLM/云API)、API密钥、模型名称等参数。
4. 启动仿真
单进程运行:
python src/main.py
多进程并行:
python src/main_mp.py
5. 启动Web Demo
cd demo python app.py
访问本地端口即可查看可视化仿真界面。
6. 执行评测
仿真完成后自动运行LifeSim-Eval,输出个性化得分、记忆准确率、意图匹配率等指标报告。

六、竞品对比
| 对比维度 | LifeSim | 传统单轮评测框架 | 通用智能体仿真平台 |
|---|---|---|---|
| 核心定位 | 长周期AI助手个性化评测 | 短对话任务型评测 | 通用智能体社会仿真 |
| 用户建模 | BDI认知模型+真实时空约束 | 固定规则/简单prompt | 群体智能+知识图谱 |
| 评测周期 | 天/周/月级长周期 | 单轮/短多轮对话 | 自定义时长但无助手专项 |
| 场景聚焦 | 个人生活+AI助手交互 | 通用问答/任务执行 | 社会/经济/群体行为 |
| 开箱即用 | 内置数据集+完整评测 | 需自定义prompt与数据 | 需自行构建角色与场景 |
| 学术支持 | 配套论文+标准化基准 | 无统一学术基准 | 学术场景较少 |
七、常见问题解答
Q:运行项目需要GPU吗?
A:非必需。使用云API模型可完全CPU运行;本地部署大模型建议使用NVIDIA GPU,显存≥16GB。
Q:如何自定义用户画像与生活事件?
A:直接修改data目录下的users.jsonl与events.jsonl文件,按预设字段添加用户属性、事件描述、触发条件即可。
Q:支持接入国内大模型API吗?
A:支持。所有兼容OpenAI API规范的国内模型(如DeepSeek、通义千问、文心一言)均可通过修改配置接入。
Q:长周期仿真运行时间过长怎么办?
A:可调整仿真时间步长,或使用多进程脚本并行加速,也可缩减仿真用户数量与事件密度。
Q:仿真结果如何导出与分析?
A:项目会自动保存交互日志、轨迹数据与评测报告,支持JSON/CSV格式,可直接用于论文绘图与数据分析。
Q:没有编程基础可以使用吗?
A:可以。Web Demo提供图形化操作界面,无需修改代码即可完成基础仿真与结果查看。
八、相关链接
GitHub开源仓库:https://github.com/dfy37/lifesim
官方在线Demo:http://fudan-disc.com/lifesim/
九、总结
LifeSim作为业内首个专注于长周期个性化AI助手评估的开源生活模拟器,以BDI认知模型与真实时空环境为核心,构建了从用户轨迹生成、交互仿真到标准化评测的完整体系,有效解决了传统评测方式脱离真实用户长期行为、无法衡量持续个性化能力的痛点。项目具备架构模块化、模型接入灵活、数据集完善、使用门槛低等优势,既可为学术研究提供可复现的实验平台,也能为企业AI助手产品提供落地级测试工具,搭配LifeSim-Eval基准形成了完整的长周期评测方案,是大模型个性化研发与评测领域的重要开源基础设施。
版权及免责申明:本文由@AI工具箱原创发布。该文章观点仅代表作者本人,不代表本站立场。本站不承担任何相关法律责任。
如若转载,请注明出处:https://www.aipuzi.cn/ai-news/lifesim.html

