主要观点总结
文章介绍了人形机器人发展的最新进展,特别是智元机器人发布的灵犀X2机器人的特点和其运动原理。文章详细解释了机器人如何通过学习人类的运动模式来实现行走、跑步等动作,以及机器人在理解人类动作背后的深层逻辑方面的尝试。文章还介绍了智元机器人在模仿学习、数据收集、知识共享等方面的创新,以及大模型在机器人领域的应用前景。
关键观点总结
关键观点1: 智元机器人发布的灵犀X2展示了人形机器人的最新进展
灵犀X2机器人展示了生动的行为,如行走、小跑、骑自行车等,表明人形机器人的发展速度很快。
关键观点2: 机器人通过学习和模仿人类的运动模式来实现动作
机器人通过强化学习、模仿学习等技术来理解和模仿人类的运动模式,从而实现各种动作。
关键观点3: 机器人在理解人类动作背后的深层逻辑方面进行了尝试
机器人通过学习人类的运动模式,尝试理解动作的深层逻辑,从而更好地模仿人类的行为。
关键观点4: 智元机器人在数据收集、模仿学习、知识共享等方面进行了创新
智元机器人通过AgiBot World和AgiBot Digital World两个项目,收集了大量的机器人实操数据,并尝试通过模仿学习和知识共享来训练机器人。
关键观点5: 大模型在机器人领域的应用前景广阔
大模型有助于机器人理解现实世界的复杂性,通过知识共享和迁移,有望推动人形机器人的突破。
正文
没错,
在机器人动力学中,确实也会将人形机器人简化为一个线性倒立摆模型,即著名的 LIPM 模型
,它能很好地抓住人形机器人运动的基本规律。
在这个模型中,假设机器人所有重量集中在一个质心点上,用无质量的杆撑在地面上,在行走时保持质心高度不变。
这时,在地面上存在一个点,
围绕这个点可以计算出所有水平方向的力矩之和为零,称之为零力矩点,即 ZMP
( Zero Moment Point )
。
零力矩点说明机器人不会围绕这个点上的平行于这个平面的轴旋转。
( 可以理解为不会旋转着摔倒在地 )
如果你觉得这样理解太抽象,你可以看看花滑运动员,他们的身体如果围绕身体竖直方向的力矩之和是不为零的,那么其就会开始旋转。
大概理解了什么是 ZMP 之后,我可以告诉你一个公式,这个公式就是机器人行走时的 “ 倒立摆 ” 公式:
你不需要理解这个东西,你只需要知道我们把 “
行走
” 这件事转化成了一个方程,想要走好路,我们要做的就是解方程。
不过,LIPM 模型很简单,他是一个比较理想的模型,生活中很难有完全近似于这个简单模型的运动。比如机器人的速度变化过大,质心变化过大
( 比如乱蹦乱跳或跳舞 )
,或质心不稳定
( 比如抓握物品或身上挂着不稳定的器件 )
,都会让实际情况脱离模型,带来很大的平衡难题。
所以,你会看到早期的机器人都用小碎步行走
,这样可以保持更加平稳的速度以及更小的加速度,从而偏移程度小,更容易保持平衡。
而机器人用弯曲的膝盖行走,可以让质心保持在相同高度,更加适配这个极简的模型,也就避免了更多复杂因素的引入。
从以上讨论中,我们也可以对运动有一个新的认识角度。
行走并不是时刻保持着平衡状态,而是不断处于一只脚制造失衡而另一只脚消除失衡的动态平衡过程,从而推动机器人前进。
LIPM 模型讨论的是对机器人运动的限制因素,但在实际运动中,机器人当然并不是按照方程完全被动地行走的,而是先规划一个参考 ZMP 的路线,再按照计算的质心位置和加速度实际去行走,确保在这过程中,实际的 ZMP 与参考 ZMP 尽可能重合,从而保持平衡。
而机器人要在任意时刻保持平衡,就需要保持 ZMP 点
( 上图机器人身体下方标记的一个点 )
位于支撑多边形内。支撑多边形可以简单理解为上图机器人的接触地面的脚围成的多边形。
这太复杂了,看到这里你可能快要晕了,不过没关系,机器自己也不理解,所以,注入灵魂的步骤开始了:
我们试图让机器自己学会理解如何去走路、做动作。
行走、奔跑等基本的运动行为一般是通过经典 AI 算法强化学习训练得到的,早年一直不用 AI 技术、成本降不下来的波士顿动力现在也在用强化学习来训练 Spot 机器人和 Atlas 机器人。
强化学习的原理大致是,比如
机器人在行走时,如果采用了正确的步伐或者没有摔倒,就提供奖励,如果采用了错误的步伐或者摔倒了,就进行惩罚。
这在游戏的语境中很容易理解,吃豆人吃到豆子了就有奖励,被幽灵抓住了就有惩罚。