10.3969/j.issn.1671-1815.2011.07.039
基于CA-CMAC的Q学习截球算法
CMAC神经网络的主要优点在于其局部修正权重系数,使每次修改的权重系数极少,因此具有快速学习能力,非常适合于在线实时控制.但是在实际的使用过程中,CMAC算法会产生可信度的分配问题.因此使用CA-CMAC来代替CMAC.Q学习是一种重要的强化学习方法,将Q学习与CA-CMAC网络相结合用到Robocup仿真环境中,使智能体通过学习训练球员的截球能力.通过实际的仿真取得了很好的效果,证明算法是有效可行的.
Robocup、CA-CMAC、Q学习、智能体
11
TP242.6;TP183(自动化技术及设备)
2011-07-19(万方平台首次上网日期,不代表论文的发表时间)
共3页
1580-1582