10.16652/j.issn.1004-373x.2019.17.040
基于极限学习机的自动化图书信息分类技术
针对数字图书馆领域中的中文图书书目自动化分类问题,提出一种基于极限学习机的自动化图书信息分类方法.首先使用基于统计的分词方法对图书信息进行预处理形成特征项集合,并采用信息增益(IG)实现特征选择,从而减少特征项的数量;然后通过基于TF-IDF特征权重的向量空间模型进行文本表示;最后采用机器学习算法中的极限学习机对图书语料进行学习和测试.实验结果表明,相比朴素贝叶斯分类、K最近邻策略分类和支持向量机分类,基于极限学习机的分类方法可以有效实现图书自动分类过程,并具有较高的准确率和分类效果.
图书分类、机器学习、极限学习机、文本表示、TF-IDF、特征选择、图书语料测试
42
TN911.1-34;TP319
2015年度广东省图书馆科研课题:基于领域本体的数字图书馆读者兴趣大数据挖掘与建模研究GDTK1527;2015年度广东省图书馆科研课题:社交网络服务在高校图书馆阅读推广中的应用研究GDTK1532;2017年华南理工大学中央高校基本科研业务费项目:基于ESI的学科分析模型构建及应用研究Z2TS/C2170520;2018年华南理工大学中央高校基本科研业务费项目:智慧图书馆资源聚合与服务推荐研究Z2TS/D2181380
2019-09-18(万方平台首次上网日期,不代表论文的发表时间)
共4页
183-186