10.3969/j.issn.1007-7634.2006.01.023
基于潜在语义索引和遗传算法的文本特征提取方法
本文采用潜在语义索引(LSI)和遗传算法(GA)进行文本特征提取.在采用潜在语义索引将语义关系体现在VSM(Vector Space Model)中,通过奇异值分解(SVD,Singuk Value Decomposition)可以有效地降低向量空间的维数,但通过维数约简后的文本特征仍要保持在数百维左右,因此本文采用遗传算法在此基础上继续降维.实验结果表明,这两种方法结合可以极大的降低文本向量空间的维数,并能提高分类准确率.
特征提取、潜在语义索引、遗传算法、Kohonen网络
24
TP301.6(计算技术、计算机技术)
中国科学院资助项目60275020
2006-07-31(万方平台首次上网日期,不代表论文的发表时间)
共4页
104-107