2020年度  第10期


标题:网联环境下基于深度强化学习的单路口交通信号控制优化
作者:龙顺忠1,2;王志建1;刘皓2,3
作者单位:1 北方工业大学电气与控制工程学院交通设备与控制工程系,北京100144;2 中国科学院自动化研究所复杂系统管理与控制国家重点实验室,北京 100190;3 中国科学院大学人工智能学院,北京 100049
关键字:深度强化学习;DQN算法;SUMO仿真;信号控制策略
摘要:深度强化学习能为交通信号控制研究带来诸多优化空间,它能够实现Agent与道路交通环境之间的交互,根据获得的惩罚或奖励不断地学习知识,从而更加适应环境。研究主要是基于深度强化学习和SUMO仿真的方法,以从仿真的方式建立的智能网联车辆环境中得到单路口交通实时动态信息,并从中输出深度Q网络(DQN)算法所需要的重要参数。基于搭建的深度神经网络,通过不断优化它的权重参数来提高性能,进一步实现对单路口交通信号控制方案的优化,并最终探索一个能够通过自主学习来高效控制单路口交通的信号控制方案。