10.3969/j.issn.1674-098X.2011.09.207
动态环境下多智能体协作学习方法的研究
将预测分析技术和强化学习技术有机结合,使多Agent系统中的各Agent,不仅具有了高度反应自适应性,而且拥有了高效而准确的预测分析能力;使Agent的行为更具有针对性,尽可能地减少错误,保证学习的正确方向,提高Agent间进行信息共享,融合单个Agent的Q值表.相当于相同情况下增加了学习次数,不仅尽可能地消除策略中的冗余动作,以高效的方式实现最终目标,而且提高多Agent系统执行效率和收敛速度及性能.本文提出了一种改进的多Agent间协作学习方法,适用于环境不完备的复杂情况.以追捕问题作为仿真实验.结果表明所提方法能够有效地促进多智能体系统中各Agent间协作学习能力.
多智能体系统、强化学习、协作学习、预测分析技术、追捕问题、黑板模型
TP18(自动化基础理论)
2011-09-13(万方平台首次上网日期,不代表论文的发表时间)
共2页
253-254