ITBear旗下自媒体矩阵:

银河通用与清华联手:人形机器人解锁高动态网球对打新技能

   时间:2026-03-18 00:32:41 来源:ITBEAR编辑:快讯 IP:北京 发表评论无障碍通道
 

在机器人技术领域,人形机器人完成复杂运动任务一直是极具挑战性的课题。近日,一项由北京银河通用机器人与清华大学研究团队联合开展的研究,成功实现了全球首次人形机器人在高动态环境下完成网球对打任务,为机器人运动能力的发展开辟了新路径。

网球运动对机器人而言难度极高。高速飞来的球要求机器人瞬间做出判断,全身协同动作决定回球质量,满场奔跑则持续考验其爆发力与控制力。然而,研究团队打造的机器人却能在球场上展现出令人惊叹的表现。它能够迅速移动脚步调整站位,上下半身协同挥拍,精准地将球回击到指定位置。面对各种来球,机器人持续调整身体姿态与击球时机,与不同水平的对手完成多回合连续对拉。

在高动态、高对抗的网球环境中,机器人面临着诸多难题。来球时速超过几十公里,落点轨迹变幻莫测,对手的击球节奏也不断变化。但令人瞩目的是,这一能力并非依靠预编程动作实现,而是机器人通过深度强化学习自主习得,实现了从“机械复刻动作”到“智能决策响应”的重大跨越。

这一成果背后,是研究团队提出的名为LATENT(Learning Athletic Humanoid Tennis Skills from Imperfect Human Motion Data)的新研究方法。传统的人形机器人运动学习往往依赖高质量遥操作数据,但在网球这类高动态运动场景中,此类数据极难获取。完整记录一场网球比赛的人体运动,不仅需要高精度、大范围的动作捕捉系统,精准获取运动员击球手部动作也十分困难,成本高昂且几乎无法实现。

LATENT研究方法另辟蹊径。它不依赖昂贵且难以获取的网球全场比赛跑动数据,也不依赖精准的运动员击球手部动作,仅通过收集前后移动、正反手挥拍、横向步伐等碎片化动作,让机器人自主学习运动技能空间,构建“运动小脑”,从而解锁大范围跑动急停、回击各种来球的运动能力。这种方法将难以规模化采集的完美专家数据替换为易获取但不完美的人类动作数据,从源头上打开了机器人运动技能学习的数据通路。

要让机器人完成复杂运动任务,仅学习动作片段远远不够,关键在于整合零散经验形成可执行的运动技能。研究团队提出在隐空间中构建“运动技能空间”,将碎片化的人类动作先验组织为可组合、可泛化的技能结构。同时,在训练过程中对关键自由度施加随机扰动,使该空间允许关键自由度可被修正、可探索。这样,机器人不再机械复刻训练数据,而是获得一个既保留自然运动风格,又允许击球细节被修正的技能表示,为后续任务学习出强于原始数据的技能奠定了基础。

在训练过程中,强化学习驱动的规划器在“运动技能空间”中进行采样与组合。面对不同来球,机器人根据球速、落点以及自身姿态,实时自主规划步伐、挥拍节奏和身体姿态,在保持自然运动风格的同时实现稳定击球。机器人还会根据实时感知对动作进行微调,特别是在击球末端自主修正挥拍轨迹,从而精准控制回球方向与落点,使回击更加稳定、精准。

在高动态运动中,机器人不仅要完成任务,还要保证动作质量。若完全依赖强化学习探索,机器人可能会采用抖动、不自然动作等“投机取巧”策略勉强击球,虽完成任务但动作质量严重下降。为避免这一问题,研究团队提出了隐空间动作屏障Latent Action Barrier(LAB)。

LAB为强化学习提供了受约束但不僵化的探索机制。策略可针对不同来球、自主跑位以及击球动作灵活调整,同时不会轻易偏离自然的人类运动模式。在训练过程中,机器人既能保持自然稳定的运动风格,又能逐渐适应不同来球情况,实现更精准的击球控制,最终在高动态环境中稳定击球且动作自然流畅。

为验证LATENT的性能,研究团队将策略部署至29自由度的宇树G1机器人,在MuJoCo仿真器和真实世界中进行了大量测试。系统对比LATENT与经典基线算法(如PPO、AMP)的性能表现后发现,LATENT在击球成功率(SR)、回球落点精准性(DE)、关节顺滑程度(Smth)与关节力矩(Torque)上优势显著,不仅打得准,而且动作丝滑。

在真实物理世界中,研究者进行了连续20局的人类 - 机器人连续网球对拉实验,涵盖机器人正手击球、反手击球、前场击球、后场击球等多种设置。真实世界复杂多变,为在不同场地、材质的网球地面上稳定击打,研究者在仿真中对地面弹性系数、空气阻力、网球质量、机器人本体动力学性质等多个方面进行随机扰动,并借助GPU进行大规模强化学习训练。实验证明,LATENT在不同球场位置、不同击球动作下均有较高击球成功率和精准度,域随机化的加入和训练中观察噪声的引入对真机性能表现起到关键作用,测试时机器人运动自然且稳定。

研究团队还在仿真中统计了机器人400轮网球回击过程中的全场跑动范围,并可视化跑动范围和击球轨迹。实验表明,搭载LATENT策略的机器人跑动范围覆盖全场,有能力接到来自各个方向的刁钻击球。研究团队还展示了两个机器人之间的连续对练场景,这为未来机器人的自主学习与持续能力进化带来更多想象空间。

此次研究的成功,离不开银河通用在人形机器人领域的持续深耕。作为中国具身智能模型路线的代表性企业之一,银河通用也是少数将模型能力真正落地到真实产业场景的公司。该公司成立于2023年5月,今年2月最新一轮融资25亿元,刷新具身智能行业单轮融资纪录,估值突破210亿元,稳居中国人形机器人领域估值最高的未上市企业,累计融资额也居首位。

银河通用已形成硬件 - 模型 - 生态的完整闭环。在硬件层面,Galbot(G1)轮式双臂本体高效折叠,支持2.4米高摸底触地,兼顾灵活度与性能迭代;技术路线上,主打“仿真为主、真机为辅”的虚实结合训练管线,自研仿真系统生成百亿级机器人干活数据集,破解行业真实数据稀缺难题,实现Sim2Real无缝迁移,为具身能力扩展奠定基础;产业落地层面,其版图已覆盖工业、零售、仓储物流、医疗康养等多个领域,正将机器人从实验室推向日常生活与真实产业,构建起完整的具身智能生态网格。

该研究论文的共同第一作者为银河通用研究团队成员张智楷、卢昊飞、连允睿,三人均为清华大学在读研究生;通讯作者为清华大学交叉信息研究院助理教授、上海期智研究院PI弋力。

 
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version