2023年度  第3期


标题:基于先验知识的HVAC系统深度Q网络控制方法
作者:韩智聪1,2 王哲超1,2 李 可1,2 马帅1,2
作者单位:1苏州科技大学电子与信息工程学院,江苏 苏州 215009;2 苏州科技大学江苏省建筑智慧节能实验室,江苏 苏州 215009
关键字:强化学习;先验知识;加速收敛;暖通空调
摘要:强化学习方法在近年来被逐渐尝试应用于工程控制之中,并且展示出其强大的控制能力和潜力。强化学习算法虽然具有较好的控制性能,但是其控制策略的收敛需要建立在一段时间后的训练上,而这段时间在工程应用上可能会造成一些浪费。为了解决这一问题,提出了基于先验知识的DQN对暖通空调(HVAC)系统中的冷却水系统进行控制,将先验知识引入DQN算法的前期训练中,以减少训练时间,加速收敛,节约成本。基于先验知识的DQN算法不仅能够对系统进行有效的控制,并且能够比DQN更早地实现节能。