DOI：10.19363/J.cnki.cn10-1380/tn.2021.05.01

黑盒机器学习模型的成员推断攻击研究

引用

摘要：

近年来,机器学习技术飞速发展,并在自然语言处理、图像识别、搜索推荐等领域得到了广泛的应用.然而,现有大量开放部署的机器学习模型在模型安全与数据隐私方面面临着严峻的挑战.本文重点研究黑盒机器学习模型面临的成员推断攻击问题,即给定一条数据记录以及某个机器学习模型的黑盒预测接口,判断此条数据记录是否属于给定模型的训练数据集.为此,本文设计并实现了一种基于变分自编码器的数据合成算法,用于生成与给定模型的原始训练数据分布相近的合成数据;并在此基础上提出了基于生成对抗网络的模拟模型构建算法,利用合成数据训练得到与给定模型具有相似预测能力的机器学习模型.相较于现有的成员推断攻击工作,本文所提出的推断攻击无需目标模型及其训练数据的先验知识,在仅有目标模型黑盒预测接口的条件下,可获得更加准确的攻击结果.通过本地模型和线上机器学习即服务平台BigML的实验结果证明,所提的数据合成算法可以得到高质量的合成数据,模拟模型构建算法可以在更加严苛的条件下模拟给定模型的预测能力.在没有目标模型及其训练数据的先验知识条件下,本文所提的成员推断攻击在针对多种目标模型进行攻击时,推断准确率最高可达74％,推断精确率可达86％;与现有最佳攻击方法相比,将推断准确率与精确率分别提升10.7％及11.2％.

关键词：机器学习、黑盒模型、成员推断攻击、变分自编码器、生成对抗网络

所属期刊栏目：6

分类号：TP181;TP309(自动化基础理论)

资助基金：国家自然科学基金;国家自然科学基金;国家自然科学基金;国家自然科学基金;中央高校基本科研业务费专项;湖北省自然科学基金;国家级大学生创新创业训练计划项目;国家级大学生创新创业训练计划项目

在线出版日期：2021-06-07（万方平台首次上网日期，不代表论文的发表时间）

页数：共15页

页码：1-15

英文信息展示

期刊专题