10.16791/j.cnki.sjg.2023.08.011
基于随机掩码和对抗训练的文本隐私保护实验
针对深度学习文本表示隐私保护面临可用性与隐私性难以平衡的问题,该文提出一种基于随机掩码和对抗训练的文本表示隐私保护算法RMAT.该算法首先对原始输入文本序列做随机掩盖,之后注入差分隐私噪声,并结合模拟攻击器与任务分类器间的对抗训练,实现深度学习文本表示的隐私脱敏.文章通过理论推导证明了算法满足差分隐私要求,并用5个公开数据集的实验结果验证了算法在提供完备隐私保障的同时提升了脱敏文本的可用性.通过本项实验,学生不仅对深度学习文本表示模型面临的安全风险有了更清晰的认识,还提升了利用深度学习方法分析和解决安全问题的能力.
隐私安全、文本表示、差分隐私、对抗训练
40
TP391.1(计算技术、计算机技术)
国家242信息安全计划;国家242信息安全计划
2023-12-08(万方平台首次上网日期,不代表论文的发表时间)
共5页
72-76