非平衡样本下基于生成对抗网络过抽样技术的公司债券违约风险预测研究
本文基于我国在公开市场发行过信用类债券的违约数据,利用了基于Wasserstein距离的生成对抗网络模型和SMOTE抽样技术对违约样本进行过抽样以提高非平衡样本下违约风险模型的预测效果.为检验过抽样技术对分类模型的改进效果,实证分析对不同的重抽样样本类别比例下分类模型的预测结果进行比较.研究结果表明过抽样技术能够显著地分类模型的预测精度,而且预测效果随着样本类别比例达到平衡而不断提高.和经典的SMOTE抽样技术相比,基于Wasserstein距离的生成对抗网络过抽样技术不仅可以提高分类模型的AUC指标,同时还能显著地改进F1得分.研究结果表明通过生成对抗网络对少数类样本进行过抽样能够显著地提升机器学习算法对债券违约风险的预测效果,为研究非平衡样本下的债券违约风险预测提供一种新的解决思路.
债券违约风险、生成对抗网络、非平衡样本分类、过抽样技术
42
F830.5(金融、银行)
国家自然科学基金;西南财经大学数据科学与商业智能联合实验室资助
2022-11-24(万方平台首次上网日期,不代表论文的发表时间)
共18页
2617-2634