面向飞行目标的多传感器协同探测资源调度方法
针对飞行目标机动性带来的多传感器协同探测资源调度动态性需求,提出一种新的基于近端策略优化(Proximal policy optimization,PPO)与全连接神经网络结合的多传感器协同探测资源调度算法.首先,分析影响多传感器协同探测资源调度的复杂约束条件,形成评价多传感器协同探测资源调度过程指标;然后,引入马尔科夫决策过程(Markov de-cision process,MDP)模拟多传感器协同探测资源调度过程,并为提高算法稳定性,将Adam算法与学习率衰减算法结合,控制学习率调整步长;最后,基于改进近端策略优化与全卷积神经网络结合算法求解动态资源调度策略,并通过对比实验表明该算法的优越性.
多传感器协同、资源调度、马尔科夫决策过程、强化学习
49
TP391;F270.7;F406.2
2023-07-12(万方平台首次上网日期,不代表论文的发表时间)
共14页
1242-1255