10.3969/j.issn.1671-1815.2011.04.017
基于人工神经网络的并行强化学习自适应路径规划
强化学习是通过对环境的反复试探建立起从环境状态到行为动作的映射.利用人工神经网络的反馈进行权值的调整,再与高学习效率的并行强化学习算法相结合,提出了基于人工神经网络的并行强化学习的应用方法,并通过实验仿真验证了迭代过程的收敛性和该方法的可行性,从而有效地完成了路径学习.
并行强化学习、BP神经网络、路径规划、Q学习
11
TP183(自动化基础理论)
2011-04-29(万方平台首次上网日期,不代表论文的发表时间)
共4页
756-759