水面无人艇自适应危险规避决策过程收敛性分析

引用

摘要：

水面无人艇(unmanned surface vehicle,USV)是一种重要的海洋自主机器人,当前正被广泛研究并逐渐应用于实际.然而USV的安全航行问题仍严重制约其自主性能的提高,尤其是在复杂海况下的危险规避问题亟待解决.以Sarsa在线策略强化学习算法为基础,提出了USV在复杂海况下的自适应危险规避决策模型,并以渐进贪心策略作为行为探索策略,证明了USV自适应危险规避决策过程能够以概率1收敛到最优行为策略.论证结果表明,采用在线策略强化学习算法提升USV在复杂海况下的危险规避性能是可行的.

关键词：水面无人艇、复杂海况、Sarsa在线策略强化学习、自适应危险规避决策过程、渐进贪心策略

所属期刊栏目：51

分类号：TP181(自动化基础理论)

资助基金：国家自然科学基金项目60975071,61100005,60975019

在线出版日期：2015-01-27（万方平台首次上网日期，不代表论文的发表时间）

页数：共9页

页码：2644-2652

英文信息展示

期刊专题