基于概率数据流的有效聚类算法
提出-种在概率数据流上进行聚类的有效方法P-Stream.P-Stream针对数据流上的概率元组提出强簇、过渡簇和弱簇的概念,设计-种有效的在线候选簇选择策略,为每个不断到达的数据元组合理地找到可能归属的簇,并在每个检查点存储微簇快照,以便离线进-步高层聚类和演化分析.最后设计-个"积极"的二层聚类模型来判断现有的第1层聚类模型是否还适应数据流中最近到达的概率元组.实验采用KDD-CUP'98和KDD-CUP'99真实数据集以及变换高斯分布的人工数据集构造概率数据流.实验结果表明,P-Stream具有良好的聚类质量、较快的处理速度,能够有效地适应数据演化情况.
概率数据流、聚类、演化分析
20
TP181(自动化基础理论)
the National Basic Research Program of China under Grant No.2005CB321905国家重点基础研究发展计划973
2009-06-09(万方平台首次上网日期,不代表论文的发表时间)
共16页
1313-1328