一类用于井下路径规划问题的Dyna_Q学习算法

引用

摘要：

在基于目标的强化学习任务中,欧氏距离常用于Dyna_Q学习的启发式规划中,但对于井下救援机器人路径规划这类状态空间在欧氏空间内不连续的任务效果不理想.针对该问题,文章引入流形学习中计算复杂度较低的拉普拉斯特征映射法,提出了一种基于流形距离度量的改进Dyna_Q学习算法,并在类似于井下环境的格子世界中进行了仿真研究.仿真结果验证了该算法的有效性.

关键词：Dyna_Q学习、欧氏距离、启发式规划、路径规划、拉普拉斯特征映射、流形距离

所属期刊栏目：38

分类号：TD67(矿山电工)

资助基金：国家自然科学基金资助项目61273143;中国矿业大学青年科技基金项目OC080252

在线出版日期：2013-03-15（万方平台首次上网日期，不代表论文的发表时间）

页数：共6页

页码：71-76

英文信息展示

期刊专题