基于构造性神经网络与全局密度信息的不平衡数据欠采样方法
多数类欠采样是当前数据层面解决不平衡数据学习的主流技术之一,近年来,研究者们提出了一系列的欠采样方法,但大多都将重点放在如何选择代表性的样本,从而降低信息损失.然而,如何在欠采样过程中保持多数类内部的结构信息,仍然是欠采样面临的主要挑战.针对该挑战,提出了一种基于构造性神经网络和全局分布密度的不平衡数据集欠采样方法.该方法首先基于构造性神经网络,设计了一种多数类局部模式的学习方法;然后基于多数类局部模式,设计了两种具有结构保持特性的样本选择策略;最后针对局部模式学习的随机性可能导致的采样结果非优的问题,进一步引入了 bagging 集成策略,提升了方法的性能.在 59 个数据集上与 13 种对比方法进行了对比实验,验证了所提方法在 G-mean,AUC和 F1-score这 3 个常用指标上的有效性.
欠采样、不平衡数据、分布密度、构造性神经网络、集成学习
50
TP311(计算技术、计算机技术)
2023-10-13(万方平台首次上网日期,不代表论文的发表时间)
共11页
48-58