基于深度强化学习的导弹末端约束角制导律

引用

摘要：

拦截碰撞角约束制导可以增加空空导弹的毁伤能力,而传统的比例导引律无法对导弹的打击角度进行约束.为控制空空导弹的拦截碰撞角,提出了一种基于深度强化学习的偏置比例导引律,完成了以特定倾角拦截目标的任务.引入了导弹剩余飞行时间作为强化学习模型的部分状态量,提升了智能体的学习收敛速度.与传统的比例导引律和基于落角约束的最优导引律进行了仿真对比实验.仿真结果表明,所提出的制导律在保证精准拦截目标的同时,对导弹末端碰撞角的控制精度也大于其它约束角制导律.

关键词：深度强化学习、末端约束角、比例导引律、偏置导引律、剩余飞行时间估计、过载控制

分类号：TJ765(火箭、导弹)

资助基金：十三五全军共用信息系统装备预研项目31505550302

在线出版日期：2023-03-07（万方平台首次上网日期，不代表论文的发表时间）

页数：共11页

页码：93-102,110

英文信息展示

期刊专题