10.3969/j.issn.1671-1815.2022.27.010
基于Q学习参数辨识的动物学习能力评价方法
动物在特定环境下对行为决策的学习能力是其生存的重要基础,因此,如何准确地评价动物在马尔科夫决策任务中利用过去经验与重视未来奖励的学习能力,对于动物行为学与心理学研究至关重要.设置了含有状态转移概率的马尔科夫决策任务,训练家鸽在不同状态下从两个选项中做出选择,并考虑未来收益,以最大化累计奖励.实验结束后,对家鸽的行为决策进行Q-learning建模,用学习率α评估其利用过去积累经验做出选择的能力,用折扣因子γ评估其对未来奖励的重视程度.结果表明,家鸽在马尔科夫决策任务中利用过去经验与重视未来奖励的学习能力可以通过Q-learning模型参数进行评价.
行为决策、家鸽、Q-learning、模型参数、学习能力
22
Q951+.4(动物学)
国家自然科学基金61673353
2022-11-16(万方平台首次上网日期,不代表论文的发表时间)
共8页
11842-11849