10.16442/j.cnki.qlgydxxb.2024.04.001
基于改进TD3算法的机器人路径规划
针对机器人路径规划中深度强化学习方法训练时间长、收敛速度慢的问题,提出一种改进双延迟深度确定性策略梯度算法(twin delayed deep deterministic policy gradient,TD3).该算法引入人工势场中的引力场和斥力场优化TD3 的奖励函数,引导机器人合理的避开障碍物前往目标点,从而提高算法的收敛速度和准确率;同时运用运动约束规则对机器人的运动方向进行约束,使得运动轨迹更加平滑流畅.仿真实验结果表明,在多障碍物环境中,所提算法能有效地使机器人避开障碍物并规划出合理的路径.与其他方法相比,改进后的算法规划成功率更高,规划路径更短.
机器人、路径规划、TD3、人工势场、运动约束
38
TP18;TP242(自动化基础理论)
江西省教育厅科技项目GJJ190958
2024-09-01(万方平台首次上网日期,不代表论文的发表时间)
共9页
1-9