基于特征映射的差分隐私保护机器学习方法

引用

摘要：

图像分类中的差分隐私算法在通过添加噪声的方式提高机器学习模型的隐私保护能力的同时,容易造成模型分类准确度的下降.针对以上问题,提出了一种基于特征映射的差分隐私保护机器学习方法,该方法结合预训练神经网络和影子模型训练技术,以差分向量的形式将原数据样本的特征向量映射到高维向量空间,缩短样本在高维向量空间的距离,以减小模型更新造成的隐私信息泄露风险,同时提高机器学习模型的隐私保护能力和分类能力.由MNIST和CIFAR-10数据集上的实验结果表明,ε分别等于0.01和0.11的ε0-差分隐私的模型的分类准确度分别提高到了99％和96％,说明所提方法训练的模型相比DP-SGD等现有多种常用差分隐私算法,能在更低隐私预算下保持更强的分类能力;且在两个数据集上针对该模型的推理攻击成功率降低为10％,其对推理攻击的防御能力相比传统图像分类的CNN模型有较大幅度的提升.

关键词：机器学习;差分隐私;图像分类;推理攻击;影子模型

所属期刊栏目：48

分类号：TP391(计算技术、计算机技术)

资助基金：广东省重点领域研发计划项目;广州市重点领域研发计划项目

在线出版日期：2021-08-19（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：33-39

英文信息展示

期刊专题