10.3969/j.issn.1671-1815.2014.16.021
数据挖掘中一种高效的聚类通用框架研究
随着传感器和互联网技术高速发展,数据集的规模激增,但系统的存储和处理能力仍然滞后.针对目前的数据聚类算法所需的测量值数目较多、时间开销大的不足,为了高效地解决大型数据集中的数据聚类问题,提出了一种主动式分层聚类通用框架,通过在小型数据集上重复运行离线聚类算法,既保证了算法性能,又降低了测量值计算复杂度和运行时间复杂度.然后,基于谱聚类算法讨论了本文框架,理论分析结果表明,利用O(nlg2n)个相似性数据可以恢复规模为Ω(lgn)的所有聚类,对包含n个对象的数据集,其运行时间为O(nlg3n).最后,通过全面的仿真实验,证明了所提框架的其他优异性能.
数据集、聚类、测量值、框架、运行时间
14
TP391(计算技术、计算机技术)
湖北理工学院校级科研项目12xjz41Q
2014-08-14(万方平台首次上网日期,不代表论文的发表时间)
共7页
112-118