LifeSim：复旦大学开源的长周期用户生活模拟器，AI助手个性化能力权威评测框架

AI新闻 AI工具箱 3个月前

145

一、LifeSim是什么

LifeSim是一款面向个性化AI助手长周期能力评估的开源用户生活仿真系统，由复旦大学数据科学学院团队研发，核心定位是填补现有大模型评测与真实用户生活场景脱节的空白。

传统AI助手评测多聚焦短对话、单轮任务，无法模拟用户在 days/weeks/months 级别的长期行为演化、认知变化与持续交互需求。LifeSim通过BDI认知模型+物理环境建模，生成高保真的用户生活轨迹、事件序列与意图驱动的交互行为，并基于此构建标准化评测基准LifeSim-Eval，实现对AI助手个性化理解、长期记忆、持续服务能力的量化评估。

项目完全开源，基于Python开发，模块化架构设计，支持本地大模型与云API接入，提供开箱即用的数据集、Web演示界面与全流程运行脚本，既可用于学术实验，也能直接落地到企业AI助手的研发测试环节。

LifeSim：复旦大学开源的长周期用户生活模拟器，AI助手个性化能力权威评测框架

二、功能特色

双场景仿真能力
支持单会话短周期与长周期人生轨迹两种仿真模式，覆盖单次问答到持续数月的生活交互全场景，完整还原用户行为连贯性。
BDI认知驱动建模
以信念-愿望-意图模型为核心，模拟用户真实认知逻辑：信念为用户知识与状态，愿望为潜在目标，意图为最终执行的行为决策，让交互更贴近人类决策路径。
真实物理环境约束
基于真实用户移动轨迹数据构建时空环境，融入时间、地点、天气、城市节律等要素，避免仿真行为脱离现实逻辑。
LifeSim-Eval标准化评测
提供多维度量化指标，可评估助手的个性化适配度、长期记忆能力、意图理解准确率、服务连贯性等，输出可对比的评测报告。
灵活模型接入方式
同时支持本地vLLM部署（Qwen、Llama3等开源大模型）与云API调用（OpenAI、DeepSeek、Claude等），兼容主流嵌入模型用于记忆检索。
完整可视化与工具链
内置Web Demo界面，可直观查看仿真流程与交互日志；提供多进程运行脚本、数据预处理工具、配置模板，降低使用门槛。
开箱即用的数据集
内置用户画像、事件序列、语言模板等数据集，支持自定义扩展，无需从零构建仿真数据。

三、技术细节

1. 整体架构

LifeSim采用分层模块化设计，核心分为四大模块：

认知引擎：BDI模型实现，管理用户信念、愿望、意图的生成与更新
事件引擎：基于时空环境生成生活事件，驱动用户轨迹演化
交互引擎：模拟用户与AI助手的多轮对话，采集交互数据
评估引擎：LifeSim-Eval指标计算，输出评测结果

2. 核心技术原理

BDI认知模型

信念：用户的个人信息、偏好、历史记忆、环境认知等状态集合
愿望：用户在不同场景下的潜在需求与目标集合
意图：结合信念与环境筛选后的执行目标，直接驱动交互行为

时空环境建模
基于Foursquare真实移动数据，构建城市-区域-地点三级空间结构，结合时间节律生成通勤、居家、社交等真实场景，事件触发符合现实概率分布。

模型对接层

本地推理：基于vLLM实现高吞吐大模型推理，支持多卡并行
云API：兼容OpenAI规范接口，一键接入商用模型
记忆检索：使用ChromaDB+ sentence-transformers嵌入模型，实现长期记忆高效召回

3. 仓库核心结构

lifesim/
├── requirements.txt   # 项目依赖
├── data/         # 用户画像、事件、模板数据
├── demo/         # Web演示前端与后端
├── src/
│  ├── agents/      # 用户/助手智能体
│  ├── engine/      # 仿真核心引擎
│  ├── evaluation/    # LifeSim-Eval评测
│  ├── models/      # 模型适配层
│  └── main_mp.py    # 多进程运行入口

4. 运行性能

支持多进程并行仿真，单节点可同时运行数十个用户仿真任务；长周期仿真可稳定运行数天，内存与CPU占用可控，适配常规科研服务器配置。

四、应用场景

AI助手产品研发
测试大模型在长期对话中的记忆保持、偏好学习、持续服务能力，定位产品短板，指导迭代优化。
学术研究实验
为个性化大模型、用户建模、智能体仿真等方向提供标准化实验平台，生成可复现的实验数据。
大模型评测基准建设
作为长周期评测补充方案，完善现有评测体系，更全面衡量模型真实落地能力。
教育与教学实践
用于人工智能、人机交互课程的实验教学，帮助理解用户建模与仿真系统原理。
智能产品场景验证
验证智能家居、车载助手、办公助理等产品在长期使用中的交互体验与功能稳定性。

五、使用方法

1. 环境准备

# 创建conda环境
conda create -n lifesim python=3.9
conda activate lifesim

# 安装依赖
pip install -r requirements.txt

2. 数据准备

项目内置data目录包含完整数据集，包含：

用户画像数据（users.jsonl）
生活事件数据（events.jsonl）
交互语言模板（language_templates.json）

支持自定义修改用户属性、事件类型与对话模板。

3. 模型配置

复制配置模板并修改：

cp demo/config_template.yaml demo/config.yaml

在config.yaml中设置模型类型（本地vLLM/云API）、API密钥、模型名称等参数。

4. 启动仿真

单进程运行：

python src/main.py

多进程并行：

python src/main_mp.py

5. 启动Web Demo

cd demo
python app.py

访问本地端口即可查看可视化仿真界面。

6. 执行评测

仿真完成后自动运行LifeSim-Eval，输出个性化得分、记忆准确率、意图匹配率等指标报告。

LifeSim：复旦大学开源的长周期用户生活模拟器，AI助手个性化能力权威评测框架

六、竞品对比

对比维度	LifeSim	传统单轮评测框架	通用智能体仿真平台
核心定位	长周期AI助手个性化评测	短对话任务型评测	通用智能体社会仿真
用户建模	BDI认知模型+真实时空约束	固定规则/简单prompt	群体智能+知识图谱
评测周期	天/周/月级长周期	单轮/短多轮对话	自定义时长但无助手专项
场景聚焦	个人生活+AI助手交互	通用问答/任务执行	社会/经济/群体行为
开箱即用	内置数据集+完整评测	需自定义prompt与数据	需自行构建角色与场景
学术支持	配套论文+标准化基准	无统一学术基准	学术场景较少

七、常见问题解答

Q：运行项目需要GPU吗？

A：非必需。使用云API模型可完全CPU运行；本地部署大模型建议使用NVIDIA GPU，显存≥16GB。

Q：如何自定义用户画像与生活事件？

A：直接修改data目录下的users.jsonl与events.jsonl文件，按预设字段添加用户属性、事件描述、触发条件即可。

Q：支持接入国内大模型API吗？

A：支持。所有兼容OpenAI API规范的国内模型（如DeepSeek、通义千问、文心一言）均可通过修改配置接入。

Q：长周期仿真运行时间过长怎么办？

A：可调整仿真时间步长，或使用多进程脚本并行加速，也可缩减仿真用户数量与事件密度。

Q：仿真结果如何导出与分析？

A：项目会自动保存交互日志、轨迹数据与评测报告，支持JSON/CSV格式，可直接用于论文绘图与数据分析。

Q：没有编程基础可以使用吗？

A：可以。Web Demo提供图形化操作界面，无需修改代码即可完成基础仿真与结果查看。

八、相关链接

GitHub开源仓库：https://github.com/dfy37/lifesim
学术论文地址：https://arxiv.org/abs/2603.12152
官方在线Demo：http://fudan-disc.com/lifesim/

九、总结

LifeSim作为业内首个专注于长周期个性化AI助手评估的开源生活模拟器，以BDI认知模型与真实时空环境为核心，构建了从用户轨迹生成、交互仿真到标准化评测的完整体系，有效解决了传统评测方式脱离真实用户长期行为、无法衡量持续个性化能力的痛点。项目具备架构模块化、模型接入灵活、数据集完善、使用门槛低等优势，既可为学术研究提供可复现的实验平台，也能为企业AI助手产品提供落地级测试工具，搭配LifeSim-Eval基准形成了完整的长周期评测方案，是大模型个性化研发与评测领域的重要开源基础设施。