Emu3.5:北京智源开源的原生多模态世界模型
Emu3.5是由北京人工智能研究院开源的大规模原生多模态世界模型,其基于单一340亿参数Transformer架构,以“下一状态预测(NSP)”为核心训练目标,在超13万亿多模态Token上...
Emu3.5是由北京人工智能研究院开源的大规模原生多模态世界模型,其基于单一340亿参数Transformer架构,以“下一状态预测(NSP)”为核心训练目标,在超13万亿多模态Token上...
GigaWorld-0是由极佳视界(GigaAI)开源的具身智能专用世界模型框架,其核心定位为“世界模型即数据引擎”,通过GigaWorld-0-Video和GigaWorld-0-3D两大协同组件,首次实现...
GigaBrain-0 是一款开源的视觉 - 语言 - 动作融合模型,以世界模型为核心技术支撑,能够同时处理视觉输入、语言指令和动作输出,实现智能体对动态环境的实时理解与交互。该...