期刊专题

10.16511/j.cnki.qhdxxb.2022.26.034

基于优势竞争网络的转运机器人路径规划

引用
该文提出了一种基于深度强化学习的优势竞争网络(advantage dueling double deep Q-network,AD3QN)算法作为500 m 口径球面射电 望远镜(five-hundred-meter aperture spherical radio telescope,FAST)促动器 自动化维护车间转运机器人的路径规划方法.通过预先学习竞争网络中的状态价值层,使状态价值参数根据环境状态进行初始化,减少了首次接触目标点所需要的步数;通过改进竞争网络中的贪婪搜索算法,使环境探索与利用的转变更为合理;通过改进动作选择策略,使机器人路径规划不易陷入局部极小值,进一步加快了算法收敛的速度.AD3QN算法具有动态规划能力强、实时性好、柔性高、鲁棒性强和准确率高等优点.对促动器自动化维护车间进行建模并测试网络改进前后的路径规划能力,仿真结果表明:采用AD3QN算法在首次找到目标点用时方面比一般竞争网络快176%.该研究有望提高FAST促动器的维护效率,进而减少对FAST观测时间的挤占.

FAST促动器、深度强化学习、竞争网络、路径规划

62

TP241(自动化技术及设备)

国家重点研发计划2019YFB1312702

2022-11-15(万方平台首次上网日期,不代表论文的发表时间)

共7页

1751-1757

暂无封面信息
查看本期封面目录

清华大学学报(自然科学版)

1000-0054

11-2223/N

62

2022,62(11)

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn