基于本地化差分隐私的键值数据关联分析
在群智感知系统中,从分布式数据源中持续收集和分析数据可以为先进的数据挖掘模型提供决策支持.由于数据中可能包含个人相关的信息,数据的采集和分析过程中通常伴随着隐私泄露的风险.本地化差分隐私作为先进的隐私保护方案可在用户的隐私性和数据的可用性之间提供较好的权衡.当前,键值数据作为异构类型数据,其同时含有分类数据和数值数据,基于本地化差分隐私在多维度下对键值数据进行关联分析面临着一定的挑战.针对隐私保护前提下键值数据的发布和关联分析问题,首先定义了键值数据的频率关联和均值关联问题,然后提出了适用于键值对的索引独热编码,为键值数据提供本地化差分隐私保护,最后在扰动的数据上对键值数据进行关联分析.基于仿真数据集和真实数据集的实验和理论分析验证了所提方案的有效性.
本地化差分隐私;键值数据;关联分析;均值估计;频率估计
48
TP391(计算技术、计算机技术)
国家重点研发计划项目2019QY1402
2021-08-20(万方平台首次上网日期,不代表论文的发表时间)
共6页
278-283