世界模型

MoWorld：魔芯推出的全栈NPU实时可交互AI世界生成模型

MoWorld是魔芯科技推出国内首个全栈国产化NPU实时交互世界模型，覆盖数据引擎、分层实时推理全链路，支持50FPS高帧率连续可控视频生成，低成本适配室内场景重建、实时云游戏...

3天前 AI新闻

71

Gamma-World：英伟达联合清华研发的AI世界模型，虚实场景高效协同仿真

Gamma-World（γ-World）是NVIDIA联合清华、多伦多大学推出的生成式多智能体世界模型，通过单纯形旋转智能体编码与稀疏枢纽注意力两大创新，解决传统模型对称性缺失、算力爆...

1个月前 AI新闻

105

Xiaomi Auto WorldModel：小米推出的自动驾驶仿真与数据生成AI模型

Xiaomi Auto WorldModel是小米推出的自动驾驶联合世界模型，集成WorldRec三维重建、WorldGen视频生成两大模块，采用深度耦合架构，实现秒级场景重建、极速视频推理，有效解...

1个月前 AI新闻

107

Agora-1：Odyssey推出的原生多人AI虚拟世界仿真运行工具

Agora-1是Odyssey发布的初代多智能体共享世界模型，采用仿真与渲染解耦架构，支持多人同场实时交互，依托全局统一世界状态保障场景数据同步，无需硬编码即可自主运行虚拟世...

1个月前 AI新闻

124

Vid2World：清华重大联合开源的视频扩散模型转高保真交互世界模型

Vid2World是由清华大学、重庆大学联合研发、被ICLR 2026接收的通用AI框架，核心将预训练视频扩散模型改造为自回归、动作可控的交互式世界模型，复用互联网无标注视频数据实...

2个月前 AI新闻

111

GigaWorld-1：极佳视界开源的高精度物理交互AI世界模型

GigaWorld-1是国内科技企业极佳视界自主研发的新一代动作控制类具身世界模型（AC-WM），聚焦物理世界AI交互与智能体动作模拟，是面向机器人、自动化设备、物理仿真场景打造...

3个月前 AI新闻

298

Solaris：Minecraft多人世界模型，支持TPU/GPU训练推理与VLM一致性评估

Solaris 是全球首个面向《我的世界》（Minecraft）的多人视频世界模型开源项目，由纽约大学研究团队基于 JAX 框架实现，支持 GCP TPU 训练与推理、GPU 推理，并内置 VLM-as...

3个月前 AI新闻

123

Kairos 3.0：大晓机器人开源的具身原生世界模型，物理一致生成与端侧实时推理

Kairos 3.0（开悟世界模型3.0）是大晓机器人开源的具身原生世界基础模型，以物理规律与因果逻辑为核心，采用线性时间复杂度DiT架构，实现“多模态理解—生成—预测”一体化...

4个月前 AI新闻

161

Ctrl-World：清华斯坦福联合开源的可控生成式世界模型，精准驱动机器人操控与虚拟预演

Ctrl-World 是由清华大学与斯坦福大学联合研发、基于 PyTorch 实现的可控生成式世界模型，专为机器人操控任务设计。它以 Stable Video Diffusion 为基座，通过动作条件驱动...

4个月前 AI新闻

171

LingBot-World：蚂蚁灵波开源的AI世界模拟器，支持多场景交互与视频生成

LingBot-World是一款面向交互式世界建模的开源世界模拟器，核心源于视频生成技术，由蚂蚁灵波开发并维护，定位为顶级开源世界模型。它通过从大规模游戏环境中学习物理规律与...

5个月前 AI新闻

192

Emu3.5：北京智源开源的原生多模态世界模型

Emu3.5是由北京人工智能研究院开源的大规模原生多模态世界模型，其基于单一340亿参数Transformer架构，以“下一状态预测（NSP）”为核心训练目标，在超13万亿多模态Token上...

7个月前 AI新闻

165

GigaWorld-0：极佳视界（GigaAI）开源的具身智能专用世界模型框架

GigaWorld-0是由极佳视界（GigaAI）开源的具身智能专用世界模型框架，其核心定位为“世界模型即数据引擎”，通过GigaWorld-0-Video和GigaWorld-0-3D两大协同组件，首次实现...

7个月前 AI新闻

429

GigaBrain-0：开源多模态世界模型，赋能视觉 - 语言 - 动作协同智能交互

GigaBrain-0 是一款开源的视觉 - 语言 - 动作融合模型，以世界模型为核心技术支撑，能够同时处理视觉输入、语言指令和动作输出，实现智能体对动态环境的实时理解与交互。该...

8个月前 AI新闻

57

世界模型新闻、工具、教程及资源推荐

MoWorld：魔芯推出的全栈NPU实时可交互AI世界生成模型

Gamma-World：英伟达联合清华研发的AI世界模型，虚实场景高效协同仿真

Xiaomi Auto WorldModel：小米推出的自动驾驶仿真与数据生成AI模型

Agora-1：Odyssey推出的原生多人AI虚拟世界仿真运行工具

Vid2World：清华重大联合开源的视频扩散模型转高保真交互世界模型

GigaWorld-1：极佳视界开源的高精度物理交互AI世界模型

Solaris：Minecraft多人世界模型，支持TPU/GPU训练推理与VLM一致性评估

Kairos 3.0：大晓机器人开源的具身原生世界模型，物理一致生成与端侧实时推理

Ctrl-World：清华斯坦福联合开源的可控生成式世界模型，精准驱动机器人操控与虚拟预演

LingBot-World：蚂蚁灵波开源的AI世界模拟器，支持多场景交互与视频生成

Emu3.5：北京智源开源的原生多模态世界模型

GigaWorld-0：极佳视界（GigaAI）开源的具身智能专用世界模型框架

GigaBrain-0：开源多模态世界模型，赋能视觉 - 语言 - 动作协同智能交互