10.16652/j.issn.1004-373x.2019.17.028
基于仿生学内在动机的Q学习算法移动机器人路径规划研究
针对移动机器人在未知环境中避障和路径规划自适应能力差的问题,受心理学方面内在动机启发,以加入引力势场的Q学习理论为基础,提出一种基于内在动机机制的引力场Q(IM-GPF-Q)学习算法.该算法以Q学习为理论框架,加入引力势场为算法提供先验知识,以内在动机作为内部奖励,与外部信号一起生成取向评价值,指引机器人学会自主选择最优路径.通过模拟客厅环境和两种具有陷阱的环境中进行的仿真实验,结果表明该算法能使机器人通过与外界未知环境进行交互获得认知,最终完成路径规划任务,与传统强化学习方法相比具有更快的收敛速度以及更好的自学习和自适应能力.
移动机器人、路径规划、内在动机、Q学习算法、引力势场、智能发育
42
TN99-34;TP183
国家自然科学基金61203343;河北省自然科学基金F2018209289;河北省高等学校科学技术研究青年基金项目QN2016102,QN2016105
2019-09-18(万方平台首次上网日期,不代表论文的发表时间)
共5页
133-137