2020年度  第4期


标题:基于深度递归强化学习的无人自主驾驶策略研究
作者:李志航
作者单位:广东工业大学自动化学院,广东 广州 510006
关键字:自动驾驶;强化学习;TORCS
摘要:提出了一种基于递深度递归强化学习的自动驾驶策略模型学习方法,并在TORCS虚拟驾驶引擎进行仿真验真。针对Actor-Critic框架过估计和更新缓慢的问题,结合clipped double DQN,通过取最小估计值的方法缓解过估计的情况。为了获取多时刻状态输入以帮助智能体更好的决策,结合递归神经网络,设计出包含LSTM结构的Actor策略网络的Critic评价网络。在TORCS平台仿真实验表明,所提算法相对与传统DDPG算法能有效提高训练效率。