10.3778/j.issn.1002-8331.1907-0044
深度强化学习在室内无人机目标搜索中的应用
针对室内无人机随机目标搜索效率不高、准确率低等问题,提出了一种基于空间位置标注的好奇心驱动的深度强化学习方法.用正六边形对探索空间进行区域划分,并标记无人机在各区域的访问次数,将其作为好奇心,产生内部奖励,以鼓励无人机不断探索新领域,有效避免其陷入到局部区域;训练时采用近端策略优化算法(PPO)优化神经网络参数,该算法能使无人机更快找到最优搜索策略,较好躲避障碍物,有效缩短训练周期,提升搜索效率和准确率.
深度强化学习、室内搜索、好奇心
56
TP181(自动化基础理论)
2020-09-08(万方平台首次上网日期,不代表论文的发表时间)
共5页
156-160