基于差分隐私保护的KDCK-medoids动态聚类算法
K-medoids算法对初始中心点敏感,不能有效地对动态数据进行聚类,且需要对相关的隐私数据进行保护.针对这些问题,提出了基于差分隐私保护的KDCK-medoids动态聚类算法.该算法在采用差分隐私保护技术的基础上将KD-树优化选取出的k个聚类中心和增量数据相结合建立新的KD-树,然后采用近邻搜索策略将增量数据分配到与其相应的聚类簇中,从而完成最终的动态聚类.通过实验分别对小数据集和多维的大数据集的聚类准确率及运行时间进行了分析,同时也对采用差分隐私保护技术的KDCK-medoids算法在不同数据集上的有效性进行了评估.实验结果表明,基于差分隐私保护的KDCK-medoids动态聚类算法能够在实现隐私保护的同时快速高效地处理增量数据的动态聚类问题.
KD-树、K-medoids聚类算法、差分隐私、动态聚类
43
TP393(计算技术、计算机技术)
国家自然科学基金61402241,61572260,61373017,61572261,61472192;江苏省科技支撑计划BE2015702
2016-12-16(万方平台首次上网日期,不代表论文的发表时间)
共5页
368-372