10.16358/j.issn.1009-1300.20230016
基于深度强化学习的多飞行器自适应协同航路规划
针对单一飞行器突防及作战能力受限的问题,提出一种多飞行器自适应协同航路规划方法.通过引入多智能体深度强化学习算法,构建多飞行器航路规划决策框架,对各飞行器在线航路规划指令进行求解.在此基础上,提出一种改良DL-MADDPG算法,引导智能体进行干扰学习,提升飞行器在复杂环境下的适应能力.同时,在奖励函数中分别设定协同奖励和个体奖励,有效保证多飞行器系统策略协同性和各飞行器个体策略有效性.仿真试验证明,提出的基于深度强化学习的多飞行器协同航路规划方法,具有很好的自适应性和鲁棒性,能够帮助多飞行器实现复杂多任务场景下的协同航路规划在线决策.
多飞行器、协同航路规划、深度强化学习、干扰学习、复杂环境、自适应性、在线决策
V448(航天仪表、航天器设备、航天器制导与控制)
国家自然科学基金62003267
2024-06-11(万方平台首次上网日期,不代表论文的发表时间)
共11页
106-116