10.13546/j.cnki.tjyjc.2019.20.003
基于指数分布的非均衡数据特征选择
指数分布的数据特征存在广泛,在风险预警中,正负样本是非均衡的,传统的算法不能满足该类数据特征选择的效率和准确率.为了提高指数分布的非均衡数据特征选择的效率和准确率,文章首先改进了SMOTE,消除过拟合问题,其次采用皮尔逊相关性,计算特征的相关度,选出最优特征子集,最后给出了具体算法.实验证明,该方法能够提高指数分布的非均衡数据特征选择的效率和准确率,增强了预警模型的性能.
指数分布、非均衡数据、过采样、特征选择、皮尔逊相关性
35
O212(概率论与数理统计)
湖北省教育科学规划重点课题2016GA049
2019-12-03(万方平台首次上网日期,不代表论文的发表时间)
共4页
16-19