期刊专题

10.11896/jsjkx.190600150

一种基于Q-学习算法的增量分类模型

引用
大数据时代的数据信息呈现持续性、爆炸性的增长,为机器学习算法带来了大量监督样本.然而,这对信息通常不是一次性获得的,且获得的数据标记是不准确的,这对传统的分类模型提出了挑战,而增量学习是一种重要的解决方法.但在增量学习中,样本的标记顺序将严重影响分类器的性能,特别是在分类器分类能力较弱的情况下,传统的增量学习方法容易过早地将噪声数据添加到训练集上,从而影响分类器的精度.为解决这个问题,文中提出一种基于Q-学习算法的增量分类模型.该模型利用强化学习中经典的Q-学习算法来合理选择样本增量序列,削弱噪声数据的负面影响,并实现在学习过程中自主标记样本.同时,为了解决当新增未标记样本集规模较大时,Q-学习中的状态空间与动作空间增大带来的计算复杂度和存储空间呈指数增长的问题,文中进一步给出了批量增量分类模型,有效降低了模型的计算复杂度并节约了存储空间.基于Q-学习算法的增量分类模型融合了增量学习及强化学习的思想,具有分类精度高、实时性强等优点.最后,在3个UCI数据集上进行实验来验证所提模型的有效性,结果表明该模型通过选择新增训练集合的确有助于提升分类器的精度,且由不同增量序列训练得到的分类器精度也有较大差异.基于Q-学习算法的增量分类模型可以利用已有的少量监督信息进行初始训练,通过自主标记样本构造增量训练集,并通过自监督的方式提高分类器的精度.因此,基于Q-学习算法的增量分类模型可被用于解决监督信息缺乏的问题,具有一定的应用价值.

增量学习、Q-学习、在线学习、分类、强化学习

47

TP391(计算技术、计算机技术)

国家自然科学基金;河北省自然科学基金面上项目;河北省教育厅青年基金

2020-08-26(万方平台首次上网日期,不代表论文的发表时间)

共7页

171-177

暂无封面信息
查看本期封面目录

计算机科学

1002-137X

50-1075/TP

47

2020,47(8)

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn