最近,华为离职的“天才少年”彭志辉宣布加入智元机器人,引发广泛关注。今天,智元发布了首个通用具身基座大模型Genie Operator-1(GO-1),并通过视频展示了其在递送水杯、制作餐点和迎接外宾等任务中的表现。视频还展示了数据采集过程。
GO-1的成功率比现有模型高出32%,尤其在倒水、清理桌面和补充饮料等任务中表现出色。为了提高泛化能力,智元提出了Vision-Language-Latent-Action(ViLLA)架构,并利用了高质量的数据集AgiBot World。尽管带动作标签的真实数据有限,但ViLLA架构通过隐式动作建模,有效利用了互联网大规模异构视频数据。GO-1大模型具备四大特点:学习人类视频、小样本快速泛化、一脑多形以及持续进化。智元表示,GO-1将推动机器人从特定任务工具向通用智能自主体发展。当前基础模型进展迅速,AI的发展正加速人形机器人和自动驾驶等领域的进步。