10.3969/j.issn.1673-3142.2023.10.004
面向分布式微电网的多智能体船艇机器人路径规划方法
针对普通单智能体船艇机器人复杂场景下路径规划效率低等问题,提出一种基于深度强化神经网络的分布式微电网多智能体机器人路径规划方法,该复杂背景下的路径规划方法相比传统方法在避障过程中准确率更高.提出模型的每个智能体都有一个独立的密集层来处理可伸缩性,为设定每个智能体具有相同的属性和能力,创建了一个奖励函数,用于惩罚非法行为(如碰撞)和奖励访问空闲单元格,提高了模型的鲁棒性.经实验验证,对比不同多智能体强化学习算法,多智能体策略的训练结果比基线方法准确率平均提高了 14%,在训练速度方面,比基线算法快 3 倍,能够满足实时性的要求.
多智能体、强化学习、奖励函数、路径规划
61
TP277(自动化技术及设备)
国家自然科学基金51869007
2023-10-31(万方平台首次上网日期,不代表论文的发表时间)
共4页
18-21