标题：基于改进DPPO算法的桃子套袋机器人针对动态目标的自动探寻研究
作者：谢宇峰刘树林
作者单位：上海大学机电工程与自动化学院，上海 201900
关键字：分布式多进程近端策略优化算法；路径规划；果园环境；自主探寻
摘要：桃子幼果套袋工作需大量劳动力，提出改进的分布式多进程近端策略优化算法（Distributed Proximal Policy Optimization，DPPO），即DPPO-ξClip算法，并设计了适用于果园的动态目标路径规划、避障和自动探寻训练方法，以实现桃子套袋机器人的自动化操作，缓解劳动力短缺。实验结果表明，该方法使机器人能够自主探寻目标，并在动态目标环境中表现出显著的训练效果。