10.3969/j.issn.1671-1815.2013.10.018
基于CCIPCA-LSSVM的文本自动分类算法
特征具有高维、稀疏性.为提高了文本自动分类准确率,针对PCA提取特征需要对大规模文本进行批处理,影响文本的准确率等,提出一种基于增量主元分析方法(CCIPCA)和最二小乘向量机(LSSVM)相结合的文本自动分类算法(CCIPCA-LSSVM).首先通过互信法选择文本特征,然后采用CCIPCA高维文本特征进行提取,降低特征维数,消除冗余特征,最后采用LSSVM对提取特征进行学习,并通过粒子群算法对分类器优化,建立最优文本自动分类模型.仿真结果表明,相对于其它文本分类算法,CCIPCA-LSSVM提高了文本分类准确率和召回率,解决了文本特征提取过程存在的难题.
文本分类、特征提取、最小二乘支持向量机、增量主元分析方法、粒子群优化算法
13
TP311.56(计算技术、计算机技术)
2013-06-09(万方平台首次上网日期,不代表论文的发表时间)
共6页
2704-2709