2025年度  第11期


标题:基于深度强化学习的无人艇动态目标轨迹跟踪方法
作者:江云云1;李胜苍2 周红坤2;刘靖逸1 李恒宇1
作者单位:1上海大学机电工程与自动化学院,上海 200444;2 海洋工程装备检测试验技术国家工程实验室,云南 昆明 650216
关键字:无人艇;轨迹跟踪;深度强化学习;内在好奇模块;双延迟-确定策略梯度算法
摘要:提出了一种基于深度强化学习的无人艇(USV)动态目标轨迹跟踪方法,以应对复杂海洋环境中的动态目标跟踪任务。为解决传统方法在稀疏奖励环境中泛化性能不足的问题,在双延迟-确定策略梯度(TD3)算法的基础上引入了内在好奇心模块(ICM),以增强USV的探索能力和环境适应性。仿真实验结果表明,ICM-TD3算法在未见过的复杂动态环境中表现出卓越的实时性和精确性,能够在显著减少误差的同时保持稳定的性能。与近端策略优化(PPO)算法和标准TD3算法相比,ICM-TD3算法在各项评估指标上均表现最佳。为USV的自主导航提供了一种有效的解决方案,并为进一步的算法改进提供了参考。