GigaWorld-1:极佳视界开源的高精度物理交互AI世界模型
GigaWorld-1是国内科技企业极佳视界自主研发的新一代动作控制类具身世界模型(AC-WM),聚焦物理世界AI交互与智能体动作模拟,是面向机器人、自动化设备、物理仿真场景打造...
GigaWorld-1是国内科技企业极佳视界自主研发的新一代动作控制类具身世界模型(AC-WM),聚焦物理世界AI交互与智能体动作模拟,是面向机器人、自动化设备、物理仿真场景打造...
Solaris 是全球首个面向《我的世界》(Minecraft)的多人视频世界模型开源项目,由纽约大学研究团队基于 JAX 框架实现,支持 GCP TPU 训练与推理、GPU 推理,并内置 VLM-as...
Kairos 3.0(开悟世界模型3.0)是大晓机器人开源的具身原生世界基础模型,以物理规律与因果逻辑为核心,采用线性时间复杂度DiT架构,实现“多模态理解—生成—预测”一体化...
Ctrl-World 是由清华大学与斯坦福大学联合研发、基于 PyTorch 实现的可控生成式世界模型,专为机器人操控任务设计。它以 Stable Video Diffusion 为基座,通过动作条件驱动...
LingBot-World是一款面向交互式世界建模的开源世界模拟器,核心源于视频生成技术,由蚂蚁灵波开发并维护,定位为顶级开源世界模型。它通过从大规模游戏环境中学习物理规律与...
Emu3.5是由北京人工智能研究院开源的大规模原生多模态世界模型,其基于单一340亿参数Transformer架构,以“下一状态预测(NSP)”为核心训练目标,在超13万亿多模态Token上...
GigaWorld-0是由极佳视界(GigaAI)开源的具身智能专用世界模型框架,其核心定位为“世界模型即数据引擎”,通过GigaWorld-0-Video和GigaWorld-0-3D两大协同组件,首次实现...
GigaBrain-0 是一款开源的视觉 - 语言 - 动作融合模型,以世界模型为核心技术支撑,能够同时处理视觉输入、语言指令和动作输出,实现智能体对动态环境的实时理解与交互。该...