10.3969/j.issn.1002-1167.2015.01.014
采用LDA主题模型的多种类型文献混合自动分类研究
探索对多种类型文献进行混合分类组织时LDA主题模型的可行性及优越性.以图书、期刊、网页等不同类型的馆藏文献作为实验对象,分别采用LDA主题模型与VSM模型对实验材料进行建模,采用SVM算法实现文本混合自动分类.仿真实验表明:LDA主题模型相对VSM模型具有一定优势,混合自动分类准确率最大差距达19.9%;图书与学术性期刊、网页与非学术性期刊之间的混合分类效果较好,分类准确率可达72%以上.实验证明LDA主题模型对实现多种类型文献统一组织具有较高的可行性和适用性.
LDA模型、混合分类、多种类型文献、数字图书馆
G25;G2
2015-09-18(万方平台首次上网日期,不代表论文的发表时间)
共7页
74-80