标题：基于深度递归强化学习的无人自主驾驶策略研究
作者：李志航
作者单位：广东工业大学自动化学院，广东广州 510006
关键字：自动驾驶；强化学习；TORCS
摘要：提出了一种基于递深度递归强化学习的自动驾驶策略模型学习方法，并在TORCS虚拟驾驶引擎进行仿真验真。针对Actor-Critic框架过估计和更新缓慢的问题，结合clipped double DQN，通过取最小估计值的方法缓解过估计的情况。为了获取多时刻状态输入以帮助智能体更好的决策，结合递归神经网络，设计出包含LSTM结构的Actor策略网络的Critic评价网络。在TORCS平台仿真实验表明，所提算法相对与传统DDPG算法能有效提高训练效率。