10.3969/j.issn.1002-137X.2007.09.033
一种新的演化文本流聚类算法
数据流的聚类作为聚类的一个分支,已经成为了数据挖掘的研究热点.虽然已经有不少数据流算法出现,但是大部分都是针对低维的数值型数据,很少有高维文本流的研究.本文在传统的数据流聚类框架基础上,提出了一种新的文本微聚类结构体,它更适合文本聚类,同时还将在线微聚类分为潜在微聚类和异常微聚类,提高了对孤立点的适应能力.实验表明该算法相对于其他文本流聚类算法更有效.
聚类、数据流、文本流
34
TP3(计算技术、计算机技术)
国家自然科学基金60574078;广东省自然科学基金31454
2007-11-19(万方平台首次上网日期,不代表论文的发表时间)
共4页
125-127,162