面向隐私安全的联邦决策树算法

引用

摘要：

根据用户信息进行资质审查是金融领域的一项重要业务,银行等机构由于用户数据不足和隐私安全等原因,无法训练高性能的违约风险评估模型,从而无法对用户进行精准预测.因此,为了解决数据不共享情况下的联合建模问题,本文提出一种基于联邦学习的决策树算法FL-DT(Federated Learning-Decision Tree).首先,构造基于直方图的数据存储结构用于通信传输,通过减少通信次数,有效提升训练效率;其次,提出基于不经意传输的混淆布隆过滤器进行隐私集合求交,得到包含各参与方数据信息的联邦直方图,并建立联邦决策树模型.最后,提出多方协作预测算法,提升了FL-DT的预测效率.在四个常用的金融数据集上,评估了FL-DT算法的精确性和有效性.实验结果表明,FL-DT算法的准确率比仅利用本地数据建立模型的准确率高,逼近于数据集中情况下模型的准确率,而且优于其他联邦学习方法.另外,FL-DT的训练效率也优于已有算法.

关键词：联邦学习;决策树;混淆布隆过滤器;隐私安全;数据不共享

所属期刊栏目：44

分类号：TP181(自动化基础理论)

资助基金：本课题得到国家自然科学基金;中央高校基本科研业务费

在线出版日期：2021-10-22（万方平台首次上网日期，不代表论文的发表时间）

页数：共14页

页码：2090-2103

英文信息展示

期刊专题