10.3969/j.issn.1003-3513.2008.12.008
最大词重降维算法与模拟退火算法相结合的文本聚类方法研究
提出一种基于最大词重的文本特征提取与降维算法.其基本思想是利用词在文档库的重要性,通过搜索算法将最大重要性的词从高维文档库中提取出来构成低维文档库,达到特征提取与降维的目的.在此基础上,提出利用模拟退火算法改进的K-means聚类算法对降维得到的文本进行聚类分析,实验结果表明该方法可以有效地提高聚类精度.
文本聚类、最大词重、特征提取、模拟退火
TP391(计算技术、计算机技术)
2009-03-31(万方平台首次上网日期,不代表论文的发表时间)
共5页
43-47