仿生机器人运动步态控制:强化学习方法综述
作者:郭宪 方勇纯
关键词:
仿生机器人; 运动步态; 控制方法; 强化学习; 数据驱动; 多关节; 非线性; 欠驱动;
摘要:
仿生机器人是一类典型的多关节非线性欠驱动系统,其步态控制是一个非常具有挑战性的问题。对于该问题,传统的控制和规划方法需要针对具体的运动任务进行专门设计,需要耗费大量时间和精力,而且所设计出来的控制器往往没有通用性。基于数据驱动的强化学习方法能对不同的任务进行自主学习,且对不同的机器人和运动任务具有良好的通用性。因此,近年来这种基于强化学习的方法在仿生机器人运动步态控制方面获得了不少应用。针对这方面的研究,本文从问题形式化、策略表示方法和策略学习方法 3个方面对现有的研究情况进行了分析和总结,总结了强化学习应用于仿生机器人步态控制中尚待解决的问题,并指出了后续的发展方向。
上一篇:基于几何特征的IC芯片字符分割与识别方法
下一篇:利用场景光照识别优化的双目活体检测方法