标题:基于改进DPPO算法的桃子套袋机器人针对动态目标的自动探寻研究 作者:谢宇峰 刘树林 作者单位:上海大学机电工程与自动化学院,上海 201900 关键字:分布式多进程近端策略优化算法;路径规划;果园环境;自主探寻 摘要:桃子幼果套袋工作需大量劳动力,提出改进的分布式多进程近端策略优化算法(Distributed Proximal Policy Optimization,DPPO),即DPPO-ξClip算法,并设计了适用于果园的动态目标路径规划、避障和自动探寻训练方法,以实现桃子套袋机器人的自动化操作,缓解劳动力短缺。实验结果表明,该方法使机器人能够自主探寻目标,并在动态目标环境中表现出显著的训练效果。 |