基于深度强化学习的双向装配序列规划
为了解决复杂装配模型的序列规划问题,并使算法对任意初始状态具有较高的适应性,本文提出了一种包含正向装配以及逆向拆解的一体化双向装配序列规划方法BASPW–DQN.针对复杂装配模型,首先进行了一体化装配序列规划的问题描述与形式化表示;在此基础上,引入了课程学习及迁移学习方法,对包含前向装配和逆向错误零件拆卸两部分过程的双向装配序列规划方法进行研究.在所搭建的ROS-Gazebo与TensorFlow相结合的仿真平台上进行了验证,测试结果证明此双向网络对于任意初始状态(包括零装配、部分装配、误装配等初始状态)的装配任务均可以在较少步数内完成,验证了所提方法对于解决装配序列规划问题的有效性与适应性.
智能装配;装配序列规划;深度强化学习;Gazebo
38
国家自然科学基金;天津市杰出青年科学基金项目;天津市自然科学基金;中央高校基本科研业务费项目;广东省机器人与智能系统重点实验室开放基金项目
2022-02-17(万方平台首次上网日期,不代表论文的发表时间)
共10页
1901-1910