GigaBrain-0:开源多模态世界模型,赋能视觉 - 语言 - 动作协同智能交互 GigaBrain-0 是一款开源的视觉 - 语言 - 动作融合模型,以世界模型为核心技术支撑,能够同时处理视觉输入、语言指令和动作输出,实现智能体对动态环境的实时理解与交互。该... 1周前 AI新闻 5