基于改进强化学习的无人机规避决策控制算法
针对当前无人机常用的"建图+规划"避障方法依赖于地图,构图模型参数适应性不强等问题,将无人机自主避障问题转化为强化学习框架下的决策控制问题,提出基于改进强化学习的无人机规避决策控制算法,并设计了适用于无人机导航避障控制任务的D3QN结构.实验结果表明,所设计的D3QN结构相比经典DQN结构可提升约25% 的训练效率,经过训练之后的D3QN网络能根据视觉信息做出可靠的规避控制决策,能用于指导无人机在未知无图等典型场景中进行无碰撞的探索飞行或导航飞行.
视觉避障、强化学习、马尔可夫决策、深度Q网络
44
TP29(自动化技术及设备)
2022-07-13(万方平台首次上网日期,不代表论文的发表时间)
共6页
68-73