标题:面向电动扶梯场景下的双足机器人反馈步态控制方法 作者:龚艳兰;陶重犇 作者单位:苏州市市场监督管理应急处置中心(苏州市特种设备事故调查处理中心),江苏 苏州 215031;苏州科技大学电子与信息工程学院,江苏 苏州 215009 关键字:模型预测控制;软行动者-评论家算法;价值函数;分层框架;步态控制 摘要:针对上下电动扶梯导致双足机器人质心位置发生变化,腿部、脚部和躯干关节无法及时调整质心到稳定位置,从而影响双足机器人在复杂环境中行走时稳定性差的问题,提出一种基于值函数的模型预测控制与无模型强化学习结合的分层框架算法。首先提出两个顺序框架,其中基于值函数的模型预测控制作为获得最佳动作序列的先前准备。其次,这些先前最佳动作序列用来加速无模型强化学习的策略学习。最后提出了一种值函数模型预测软行动者-评论家方法。实验表明,所提方法在基线任务上收敛速度更快,鲁棒性更好。 |