10.11896/j.issn.1002-137X.2018.06.006
基于差分隐私的多源数据关联规则挖掘方法
随着大数据时代的到来,挖掘大数据的潜在价值越来越受到学术界和工业界的关注.但与此同时,由于互联网安全事件频发,用户越来越多地关注个人隐私数据的泄露问题,用户数据的安全问题成为阻碍大数据分析的首要问题之一.关于用户数据的安全性问题,现有研究更多地关注访问控制、密文检索和结果验证,虽然可以保证用户数据本身的安全性,但是无法挖掘出所保护数据的潜在价值.如何既能保护用户的数据安全又能挖掘数据的潜在价值,是亟需解决的关键问题之一.文中提出了一种基于差分隐私保护的关联规则挖掘方法,数据拥有者使用拉普拉斯机制和指数机制在数据发布的过程中对用户数据进行保护,数据分析者在差分隐私的FP-tree上进行关联规则挖掘.其中的安全性假设是:攻击者即使掌握了除攻击目标以外的所有元组数据信息的背景知识,仍旧无法获得攻击目标的信息,因此具有极高的安全性.所提方法是兼顾安全性、性能和准确性,以牺牲部分精确率为代价,大幅增加了用户数据的安全性和处理性能.实验结果表明,所提方法的精确性损失在可接受的范围内,性能优于已有算法的性能.
隐私保护的数据挖掘、差分隐私、拉普拉斯机制、指数机制
45
TP311(计算技术、计算机技术)
国家自然科学基金61232002,61572378,61202034;湖南省自然科学基金面上项目2017CFB420;CCF中文信息技术开放课题基金CCF2014-01-02;武汉市创新团队项目2014070504020237;武汉大学自主科研项目2042016gf0020,2016-2017
2018-08-30(万方平台首次上网日期,不代表论文的发表时间)
共5页
36-40