双足机器人昂贵、复杂且易碎。单从平衡性来看,双脚站立和行走要比四足难得多,但由于双足机器人更像人,仍然有许多研讨者致力于研发双足机器人。对于机器人(双足机器人、四足机器人、履带式机器人等)来说,爬楼梯一直是一个巨大的挑战。双足机器人上下楼梯时需要大量的感知和计算,几乎是在实验阶段就相当脆弱,可能会被摔坏,甚至以失败告终。解决双足机器人走楼梯问题的一种要领是需要更好的感知力和更多的计算来摹拟楼梯和规划脚步路径。而近日来自俄勒冈州立大学和 Agility Robotics 的研讨者提出了一种要领,只是将双足机器人 Cassie 随机扔在了室外楼梯上,完整不用任何感知就完成了走楼梯的任务,并且完成效果惊人。该论文将于 7 月在 RSS(Robotics Science and Systems) 2021 上发表。
论文地址:https://arxiv.org/pdf/2105.08328.pdf双足机器人 Cassie 上下楼梯的效果如下,研讨人员为 Cassie 配备了安全绳,只是为了防止机器人「灾难性的坠落」,绳子保持松弛状况:
Cassie 还可以压马路:
复杂环境也能行走,不过还是被绊了一跤:
但是,Cassie 也有跌倒的情况:
双足机器人 Cassie需要注意的是:Cassie 不感知,也就是说它并不知道自己上楼梯或下楼梯的信息。但该机器人可以自身反馈,这意味着它知道自己的肢体与楼梯有怎样的接触。此外,由于安全绳保持松弛,因此 Cassie 不得到任何额外的帮助,安全绳只是为了防止机器人灾难性的坠落。实验进程中,Cassie 经历了诸多坎坷:它撞到了栏杆上,脚趾断了,从台阶上滑下来,完整没踩到台阶,偶尔还会倒退。但令人惊讶的是,Cassie 还能坚持走到它该去的地方。
Cassie 没踩到台阶,但它站起来之后继续完成了任务。这就是这项研讨如此令人兴奋的原因,与其尝试开发一种依靠高质量感知和大量计算的完满楼梯系统,还不如开发一种包含实际世界约束,同时设法实现这一目标。即使这不是最优雅的,但在实际世界中具有鲁棒性。研讨人员利用强化进修要领,根据典型的城市建筑规范,训练摹拟 Cassie 走楼梯,楼梯设置高达 8 个台阶。为了将进修到的爬楼梯策略有效地从摹拟迁移到实际世界中,该研讨在摹拟中设置了多种干扰,这些干扰用来体现难以精确摹拟的各种实际事物。例如,Cassie 摹拟跌倒混乱、行走速度调整以及摹拟地面摩擦引起的抖动等。因此,尽管摹拟无法完整摹拟真实的实际环境,但随机混合摹拟可以确保该机器人的控制器在各种情况下具有鲁棒性。使用强化进修来训练机器人的一个特殊之处是,有时即使提出了很是有效的要领,但也并不清楚其确切原因。论文第一作者 Jonah Siekmann 体现他们观察到:Cassie 在上楼梯时,走得越快就会走得越好。这对机器人来说有点违背直觉:
由于 Cassie 不视觉能力,因此在选择落脚点时很是糟糕。如果它试图将脚放在楼梯的拐角处,并将其重心转移到这只脚上,那么结果就是它会摔下楼梯。就步行速度而言,这并不什么大问题,因为 Cassie 的动力系统可以让它克服短瞬间的向后移动(即一定程度上避免跌倒)。在低速状况时,该动力系统不足以克服不良的落脚点带来的问题,它会不断撞到楼梯,直至跌倒。而在高速状况时,机器人往往会跳过一些台阶,从而使 Cassie 接近甚至超过其极限。
Siekmann 体现糟糕的落脚点导致了 Cassie 出现了一些「冒险行为」。他说「有时,Cassie 在下降进程中跳过了一至三个台阶,然后又恢复正常的下楼状况,这尤其令人惊讶。Cassie 在上楼时也绊倒然后又爬起来了。这个物理进程很复杂,因此学得的控制器中嵌入的那些精准的反应是很是令人兴奋的。此前我们还不见过这种鲁棒性。」如果要比较 Cassie 上下楼梯是否比蒙住眼睛的人更好,研讨者体现这很难说。Siekmann 说:「我们多次开玩笑说 Cassie 在爬楼梯方面是超人,因为在拍摄这些视频的进程中,由于要专注于拍摄 Cassie(一定程度上不看台阶),我们在上楼的进程中也绊倒了几次。」在执行动态任务时,比人类更好的机器人显然是一个很是高的标准,但也许大多数人实际上并不像 Cassie 那样为盲目楼梯导航做好准备,因为 Cassie 本身就是基于楼梯训练的,并且在训练进程中添加了少量「噪声」,以使楼梯并不是完整均匀的,以防止 Cassie 通过本体感受推导楼梯的精确尺寸,并过度拟合至完满统一的楼梯。实际上,人类在闭着眼睛尝试爬楼梯时,会依赖于「楼梯是完满统一的」这种假设。当人类无法依靠这样的假设时就会陷入困境。Cassie 和大多数机器人一样受到一些约束。如果它看上去比其他机器人更有趣,那是因为它使用的是专门针对楼梯和类楼梯场景设计的特定楼梯控制器。研讨团队成员 Green 解释说:「当你训练神经网络充当控制器时,进修算法会随着时间的推移完善网络,以使其针对特定环境的回报最大化。这意味着,与在平坦地面上进行训练相比,通过在阶梯上进行训练,我们得到了完整不同的控制器。」他体现:楼梯控制器可以在平坦的地面上正常工作,但效率较低,且噪音较大。该研讨团队正在研讨集成多个步态控制器的要领,这些步态控制器可以根据机器人的具体工作方式进行调用。这可能会涉及一些很是简单的感知系统,只是告诉机器人「嘿,前面有楼梯,你最好采用楼梯模式!」参考链接:https://spectrum.ieee.org/automaton/robotics/humanoids/agility-robotics-cassie-stairs
原创文章,作者:机器之心,如若转载,请注明出处:https://www.iaiol.com/news/34968