期刊专题

10.3969/j.issn.1671-1815.2023.08.048

航空器智能引导机动决策奖励重塑方法

引用
针对使用深度强化学习进行航空器智能引导研究中存在的飞行轨迹质量差、训练效率低等问题,对应用于机动决策生成的奖励重塑方法进行了研究.首先,构建了航空器引导机动决策生成的深度强化学习模型;其次,从指令连续性和相对姿态两个角度设计了奖励重塑函数,并证明了使用重塑函数前后的策略一致性;最后,在不同类型目的地场景中进行了仿真实验.仿真结果表明:奖励重塑方法对航空器飞行轨迹质量和智能体训练效率有明显的提升.使用本方法快速训练的智能体,可以准确、高效地生成机动决策,引导航空器完成任务.

航空器引导、机动决策、深度强化学习、奖励重塑

23

V249.1(航空仪表、航空设备、飞行控制与导航)

四川省科技计划;中央高校基本科研业务费基金项目;广西中国-东盟综合交通国际联合重点实验室资助课题

2023-05-11(万方平台首次上网日期,不代表论文的发表时间)

共9页

3535-3543

相关文献
评论
暂无封面信息
查看本期封面目录

科学技术与工程

1671-1815

11-4688/T

23

2023,23(8)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn