在科技界的瞩目下,前华为“天才少年”彭志辉参与的智元机器人公司,于近日推出了其首个通用具身基座大模型——Genie Operator-1(简称GO-1)。这一创新成果于3月10日正式发布,标志着智元机器人在具身智能领域迈出了重要一步。
GO-1的核心在于其开创性的Vision-Language-Latent-Action(ViLLA)架构,该架构巧妙融合了多模态大模型(VLM)与混合专家(MoE)系统。VLM通过广泛汲取互联网图文数据,获得了强大的场景感知和语言理解能力;而MoE则通过隐式规划器(Latent Planner)和动作专家(Action Expert)的协同作用,分别实现了对动作的高效理解和精确执行。这一架构不仅实现了从小样本到复杂任务的快速泛化,还显著降低了具身智能的应用门槛。
作为国内领先的机器人品牌,智元机器人隶属于上海智元新创技术有限公司,总部位于张江科学城。公司自成立以来,便致力于AI与机器人的融合创新,致力于打造世界级的智能机器人产品。彭志辉,这位曾经的华为天才少年,于2022年底离职后,于次年2月联合创立了智元机器人。同年8月,其团队研发的首款具身智能机器人“远征A1”便成功亮相,展现了不俗的实力。
GO-1的发布,无疑为智元机器人赢得了业界的广泛关注。与传统的Vision-Language-Action(VLA)架构相比,ViLLA架构通过引入隐式动作标记(Latent Action Tokens),成功弥合了图像-文本输入与机器人执行动作之间的鸿沟。在真实世界的灵巧操作和长时任务方面,GO-1的表现远超现有的开源模型,展现了卓越的性能。
在五种不同复杂度的任务测试中,GO-1相比已有的最优模型,成功率大幅提升,平均成功率从46%提高至78%,提高了32个百分点。特别是在“倒水”、“清理桌面”和“补充饮料”等任务中,GO-1的表现尤为突出。通过单独验证Latent Planner的作用,发现其能进一步提升12%的成功率,从66%提高至78%。
GO-1大模型的革命性在于其强大的学习能力。借助人类和多种机器人数据,GO-1能够快速适应新任务、学习新技能,并泛化应用到各类环境和物品中。同时,GO-1还支持部署到不同的机器人本体上,实现高效落地,并在实际使用中持续进化。这一特性使得GO-1在商业、工业、家庭等多领域具有广泛的应用前景。
智元机器人的快速发展,离不开资本的支持。目前,其股东名单中包括高瓴创投、鼎晖投资、红杉中国等知名投资机构,以及比亚迪、软通动力等上市公司。在业务层面,智元机器人与多家上市公司存在关联,形成了紧密的产业链合作。智元机器人还积极投资相关产业链企业,进一步巩固其在智能机器人领域的领先地位。
受智元机器人消息的刺激,相关概念股在二级市场出现了明显上涨。多家与智元机器人存在关联的上市公司股价涨幅显著,市场反应热烈。
智元通用具身基座大模型GO-1的推出,标志着具身智能正朝着通用化、开放化、智能化的方向快速发展。随着GO-1的普及和应用,机器人将从依赖特定任务的工具,逐渐转变为具备通用智能的自主体,在多领域发挥更大的作用,为人类社会的智能化进程贡献力量。