10.3969/j.issn.1001-3881.2010.20.026
基于强化学习的混合智能控制算法研究与分析
设计混合智能控制结构,该结构引入强化学习和神经网络,提出基于BP神经网络的Q学习算法,优化动作的选取,解决传统Q学习中Q表占用内存空间过大的问题,增强系统的泛化能力.将其应用到Predator-prey模型中.实验结果表明,系统无需每次从全部动作中选择,从而大大缩小了状态-动作对的数量,节省计算时间,为智能体最优策略的选择提供更大的可能性.
智能体、强化学习、神经网络、Markov决策过程
38
TP181(自动化基础理论)
江苏省自然科学基金项目BK2006176
2011-01-28(万方平台首次上网日期,不代表论文的发表时间)
共3页
75-77