2022年度  第11期


标题:基于强化学习虚拟链路驾驶行为仿真环境研究
作者:聂梓润 徐野;哈乐
作者单位:沈阳理工大学自动化与电气工程学院,辽宁 沈阳 110159;北部战区总医院医学工程科,辽宁 沈阳 110015
关键字:强化学习环境;驾驶行为;虚拟道路;智能体训练
摘要:强化学习是当前人工智能和机器学习研究领域的热门研究方向,通过反复试错和与环境的交互获得策略的改进。UBI车险则是一种基于分析驾驶行为的保险,由车联网和车载OBD设备将驾驶者的驾驶习惯、驾驶数据和车辆周围环境等数据结合起来建立模型进行定价,以规范驾驶者的行为。受以上两种技术的启发,提出一种可应用于智能体训练的环境,以解决规范以及纠正驾驶行为的问题。最后采用Deep Q Network验证了环境的的可行性。实验结果表明,智能体可在该环境中训练,并能学习到面对当前状态所要执行相应的动作。