UC伯克利给四足机器人加Buff:瞬间适应各种真实地形,抹了油的地面也能hold住...
Posted QbitAl
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了UC伯克利给四足机器人加Buff:瞬间适应各种真实地形,抹了油的地面也能hold住...相关的知识,希望对你有一定的参考价值。
丰色 发自 凹非寺
量子位 报道 | 公众号 QbitAI
随着四足机器人的应用越来越成功,它们面对的场景也会越来越多:
今天爬楼梯,明天过草地,后天又去坑坑洼洼的石子地……
这么复杂多变的地形它们可hold不住,分分钟给你表演个人仰马翻。
不过现在,来自UC伯克利、卡内基梅隆大学以及Facebook AI的研究人员发明了一种新算法:
不需要任何参考轨迹,无需微调直接部署在机器人身上——
就能让它们在瞬间适应各种复杂的新地形,一步都不带“走神”地穿过乱石、沙滩、楼梯、长植被、人为搭建的活动板等环境。
在滴了油的垫子上也是健步如飞、突然被负重5公斤也没事!
这个对于人类来说非常简单的技能,机器人现在也拥有了……
就问你厉不厉害(怕不怕)?
ps.眼尖的朋友应该能看出来,这个项目用的机器人就是咱国产的A1,来自杭州的Unitree。
如何做到的?
这个算法被命名为RMA(Rapid Motor Adaptation,快速电机自适应)。
由两部分组成:基本策略模块 (base policy, π)和自适应模块 (adaptation module, ϕ)。
算法完全在仿真环境中训练,然后直接部署于现实世界。
训练分为两个阶段。
第一阶段,将机器人当前状态、先前的动作、环境因素作为输入,使用model-free的强化学习进行基本策略训练。
第二阶段,采用on-policy数据的监督学习,训练自适应模块通过历史状态和动作来预测外部参数(extrinsics),也就是该怎么下脚。
部署阶段,自适应模块生成外部参数,基本策略模块生成所需的关节位置,并使用A1机器人的PD控制器转换为扭矩。
总的来说,基本策略模块探测环境,并实际控制机器人的步态。
自适应模块负责分析基本策略给的数据,并加以分析,然后告诉基本模块如何调整步态。
两者协同工作以便在多样化的环境中实现实时适应。
需要注意的是,该算法没有视觉输入!环境因素由机器人运动部件“感觉到”的力收集而来。
室内和室外测试
又到了评估性能的时刻,室内测试中,将三者:RMA、A1机器人本身的控制器、没有自适应模块的RMA进行了比较。
结果发现,RMA以100%的成功率走下15cm高度的台阶,并以80%的成功率走过可变形表面(记忆泡沫床垫和微微不平整的泡沫垫)。
它也能够成功爬上斜坡和台阶。
在油性表面上行走的成功为90%。
而A1的控制器在不平整的泡沫上就只有20%的成功率。
没有自适应模块的RMA就基本啥也不行了。
最下面的三张图表还说明了三种方法的有效载荷限制:
A1控制器的性能在8Kg载荷下开始下降。
没有自适应模块的RMA承载超过8Kg后就没法移动,不过倒是不会跌倒。
而RMA则在负重、保持平衡与行走距离上碾压前两者。
A1机器人的本身重量为12Kg。
而在室外:RMA在沙子、泥堆、高大植被上行走或穿越灌木的成功率为100%(不会被草缠脚)。
而在乱石堆上行走时成功率为80%。
在铺满了枯枝败叶的自然阶梯上的成功率为70%。
最后,研究人员表示,要开发出真正可靠的地形自适应机器人,现在的这个“盲人”机器人的装备还远远不够,还需配上视觉传感器等工具。这也是他们未来工作的一个重要方向。
论文地址:
https://arxiv.org/abs/2107.04034
看大量实验效果请戳:
https://ashish-kmr.github.io/rma-legged-robots/
以上是关于UC伯克利给四足机器人加Buff:瞬间适应各种真实地形,抹了油的地面也能hold住...的主要内容,如果未能解决你的问题,请参考以下文章