10.3969/j.issn.1006-2475.2015.08.019
基于概念与词根双特征互助文本分类模型
传统半监督文本分类方法,大多数建立在词根特征的基础上,忽略了语义特征的重要性,导致分类精度不高。考虑到语义对分类的影响,本文提出融合概念与词根双特征的文本分类模型。该方法以WordNet为本体库,在Co-training框架下,构造基于概念和词根的双分类器进行协同训练的分类模型。实验分析了新模型分类准确率和召回率,结果显示新模型相对于旧模型在这2方面都有提升,表明基于概念与词根双特征互助的新算法具有更高的有效性。
半监督、语义、双特征、协同训练
TP301.6(计算技术、计算机技术)
重庆市自然科学基金资助项目 cstc2012jjA40002;中央高校基本科研基金资助项目0216005207016
2015-09-08(万方平台首次上网日期,不代表论文的发表时间)
共5页
93-97