10.3778/j.issn.1002-8331.2008.24.047
基于先验知识的改进强化学习及其在MAS中应用
针对传统的多Agent强化学习算法中,Agent学习效率低的问题,在传统强化学习算法中加入具有经验知识的函数;从心理学角度引入内部激励的概念,并将其作为强化学习的激励信号,与外部激励信号一同作用于强化学习的整个过程.最后将此算法运用到RoboCup仿真中,仿真结果表明该算法的学习效率和收敛速度明显优于传统的强化学习.
多智能体系统、先验知识、内在激励、强化学习
44
TP181(自动化基础理论)
2008-10-20(万方平台首次上网日期,不代表论文的发表时间)
共3页
156-158