10.16157/j.issn.0258-7998.211934
用于巡航导弹突防航迹规划的改进深度强化学习算法
为了解决巡航导弹面临动态预警机雷达威胁下的突防航迹规划问题,提出一种改进深度强化学习智能航迹规划方法.针对巡航导弹面对预警威胁的突防任务,构建了典型的作战场景,给出了预警机雷达探测概率的预测公式,在此基础上设计了 一种引入动态预警威胁的奖励函数,使用深度确定性策略梯度网络算法(Deep Deterministic Policy Gradient,DDPG)探究巡航导弹智能突防问题.针对传统DDPG算法中探索噪声时序不相关探索能力差的问题,引入了奥恩斯坦-乌伦贝克噪声,提高了算法的训练效率.计算结果表明,改进的DDPG算法训练收敛时间更短.
巡航导弹;DDPG算法;突防策略;深度强化学习
47
TN959.1;TP181
2021-08-25(万方平台首次上网日期,不代表论文的发表时间)
共5页
11-14,19