稀疏奖励下基于强化学习的无人集群自主决策与智能协同
无人集群将深刻地塑造战争样式,为提升无人集群自主决策算法能力,对异构无人集群攻防对抗自主决策方法进行研究.对无人集群对抗模型设计进行总体概述,并对无人集群攻防对抗场景进行模型设计;针对无人集群自主决策采用强化学习技术广泛存在的稀疏奖励问题,提出基于局部回报重塑的奖励机制设定方法;在此基础上叠加优先经验回放,有效地改善稀疏奖励问题;通过程序仿真和演示系统设计,验证该方法的优越性.该方法的研究将加速基于强化学习技术的无人集群自主决策算法网络收敛过程,对无人集群自主决策算法研究具有重要意义.
多智能体、无人智能、博弈对抗、强化学习、稀疏奖励
44
TP18(自动化基础理论)
国防科技创新特区重点项目20-163-30-ZT-004-015-01
2023-07-12(万方平台首次上网日期,不代表论文的发表时间)
共10页
1537-1546