10.3969/j.issn.1002-137X.2013.08.029
(k,l)-多样性数据发布研究
发布未经处理的数据会导致身份泄露和敏感属性泄露,通过概化准标识符可以达到隐私保护的目的,但信息损失过大.针对该问题提出一种基于聚类的(k,l)-多样性数据发布模型并设计算法予以实现.通过使用概率联合分布度量数据对象的离散属性和连续属性相似性,提高了数据的效用.详细论述了簇的合并、调整和概化策略,结合参数k和l提出隐私保护度概念,指出了基于聚类的最优化(k,l)-多样性算法是NP-难问题,并分析了算法的复杂度.理论分析和实验结果表明,该方法可以有效减少执行时间和信息损失,提高查询精度.
隐私保护、数据发布、l-多样性、数据效用、聚类、相似性度量
40
TP309.2(计算技术、计算机技术)
国家自然科学基金61073043,61170060;安徽高等学校省级自然科学基金KJ2011Z098
2013-10-10(万方平台首次上网日期,不代表论文的发表时间)
共6页
140-145