一种考虑属性权重的隐私保护数据发布方法
k-匿名模型是数据发布领域用于对原始待发布数据集进行匿名处理以阻止链接攻击的有效方法之一,但已有的k-匿名及其改进模型没有考虑不同应用领域对匿名发布表数据质量需求不同的问题.在特定应用领域不同准码属性对基于匿名发布表的数据分析任务效用的贡献程度是不同的,若没有根据发布表用途的差异区别处理各准码属性的泛化过程,将会导致泛化后匿名发布表数据效用较差、无法满足具体数据分析任务的需要.在分析不同应用领域数据分析任务特点的基础上,首先通过修正基本ODP目录系统建立适用于特定问题领域的概念泛化结构;然后在泛化过程中为不同准码属性的泛化路径设置权重以反映具体数据分析任务对各准码属性的不同要求;最后设计一种考虑属性权重的数据匿名发布算法WAK(QI weight-aware k-anonymity),这是一种灵活地保持匿名发布表数据效用的隐私保护问题解决方案.示例分析和实验结果表明,利用该方案求解的泛化匿名发布表在达到指定隐私保护目标的同时,能够保持较高的数据效用,满足具体应用领域特定数据分析任务对数据质量的要求.
数据发布、隐私保护、权重、k-匿名、泛化
49
TP309(计算技术、计算机技术)
国家自然科学基金项目60673127;国家"八六三"高技术研究发展计划基金项目2007AA01Z404;高等学校博士学科点专项科研基金项目20103218110017;江苏省科技支撑计划基金项目BE2008135;安徽高校省级自然科学研究重大项目KJ2010ZD01
2012-07-17(万方平台首次上网日期,不代表论文的发表时间)
共12页
913-924