GO-2：智元机器人推出的具身智能 VLA 基座大模型

AI新闻 97ai 3个月前

400

一、GO-2是什么

GO-2（Genie Operator-2） 是智元机器人发布的新一代具身智能基座大模型（VLA模型），定位为机器人底层核心引擎，专注打通“感知—理解—规划—执行”全链路，解决具身智能领域长期存在的语义-运动鸿沟问题。

该模型基于数万小时机器人交互数据训练，首次在统一架构中实现逻辑推理与高精度运动控制深度融合，让机器人从“被动执行”升级为“先思考再行动”，标志具身智能进入知行合一新阶段，相关核心技术成果已被CVPR 2026收录。

二、功能特色

1. 核心技术突破

动作思维链（Motion Chain-of-Thought）
机器人接收指令后先完成任务拆解、路径规划、风险预判，再执行物理动作，大幅提升复杂任务成功率。
异步双系统架构
慢系统负责推理规划，快系统负责实时执行，兼顾决策准确性与控制响应速度，抗环境扰动能力显著增强。
统一多模态表征
融合视觉、语音、触觉等多模态信号，实现端到端意图理解与动作映射，无需多层模型转接。

2. 性能指标优势

测试基准	核心指标	GO-2表现	行业水平
LIBERO-Plus	零样本泛化成功率	92.3%	行业领先
长时序复杂任务	执行成功率	98.5%	大幅超越前代
环境扰动场景	鲁棒性准确率	89.7%	业界SOTA

3. 工程化特性

支持零样本迁移，新场景无需大量重训练
兼容人形、四足、机械臂等多形态机器人硬件
提供轻量化部署方案，边缘端可实时运行
开放API与SDK，降低二次开发门槛

三、应用场景

1. 工业制造领域

产线精密装配、物料分拣、设备巡检
柔性生产任务自适应调度，减少人工干预
高危环境替代人工操作，提升安全系数

2. 家庭服务领域

智能家居协同、物品取放、日常照料辅助
老人/儿童陪伴交互，语音+动作双模态响应
家庭环境自主清洁与整理

3. 科研教育领域

高校具身智能算法验证与教学实验平台
机器人研发快速原型迭代
开源社区模型微调和创新应用开发

4. 商业服务领域

商场/展馆导览、物品递送、安防巡逻
餐饮后厨辅助、仓储智能理货

GO-2：智元机器人推出的具身智能 VLA 基座大模型

四、使用方法

1. 开发接入流程

环境准备

# 安装依赖
pip install go2-sdk torch>=2.0 transformers
# 验证安装
go2 --version

模型初始化

from go2 import EmbodiedModel
# 加载基座模型
model = EmbodiedModel(pretrained="go2-base", device="cuda")
# 初始化机器人连接
model.connect_robot(robot_type="humanoid", ip="192.168.1.100")

指令执行

# 自然语言指令解析
task = "把桌上的水杯递给我"
# 规划并执行
plan = model.motion_planning(task)
model.execute(plan, speed=0.8)

2. 部署方式

云端部署：适合大规模集群调度，通过API接口调用
边缘部署：适配机器人本地算力，低延迟实时控制
仿真部署：支持Gazebo、Isaac Sim等平台，先仿真再真机验证

3. 调试与监控

提供可视化任务规划面板，实时查看动作拆解流程
支持执行日志记录与异常告警
可微调运动速度、安全阈值等参数

五、竞品对比

对比维度	GO-2	国外同类VLA模型	国内传统机器人控制模型
核心架构	统一推理+执行	分离式多模型串联	单一运动控制
动作思维链	原生支持	部分支持	无
零样本泛化	强	中	弱
硬件适配	全形态机器人	限定硬件	专用机型
部署成本	中低	高	中
开源生态	开放API/SDK	闭源为主	有限开放

GO-2以端到端统一架构与动作思维链为核心差异，在泛化能力、部署灵活性上优于竞品，更适合国内复杂场景落地。

六、常见问题解答

GO-2支持哪些类型的机器人？

GO-2原生兼容人形机器人、四足机器人、协作机械臂、移动底盘等主流硬件平台，通过驱动适配可快速接入定制化设备。

GO-2对硬件算力有什么要求？

云端部署需NVIDIA A100/H100级别显卡；边缘端推荐 Jetson AGX Orin 及以上；仿真环境普通消费级显卡即可运行。

GO-2是否支持二次开发与微调？

支持。官方提供完整SDK、API文档与微调教程，开发者可基于行业数据定制垂直场景模型，无需从头训练。

GO-2的动作执行延迟是多少？

异步双系统架构下，规划延迟约50-100ms，执行控制延迟低于10ms，满足实时交互需求。

GO-2在复杂环境下的稳定性如何？

在光照变化、障碍物移动等扰动场景中，任务执行成功率保持89%以上，具备工业级鲁棒性。

GO-2与前代GO-1相比有哪些升级？

新增动作思维链、异步双系统，泛化成功率提升40%+，支持长时序复杂任务，硬件适配范围扩大3倍。

七、相关链接

智元机器人官网：https://www.agibot.com

八、总结

GO-2作为智元机器人推出的新一代具身智能基座大模型，以动作思维链与异步双系统为核心创新，成功打通机器人从语义理解到物理执行的全链路，有效弥合语义-运动鸿沟，在多类基准测试中达到行业领先水平，同时凭借良好的硬件兼容性、低部署门槛与完善的开发工具链，可广泛落地于工业、家庭、科研、商业等场景，为具身智能产品化与规模化应用提供了稳定可靠的底层技术支撑。