10.3969/j.issn.1007-3116.2017.02.002
基于不平衡样本的互联网个人信用评估研究
国内互联网金融和消费信贷的迅猛发展,催生了互联网个人征信的巨大需求。针对不平衡的互联网征信数据,采用随机过抽样、随机欠抽样和SMOTE方法进行数据平衡化,并建立决策树、支持向量机和随机森林等分类模型对互联网个人信用评估进行研究,结果表明:互联网大数据背景下的个人信用评估研究具有可行性;过抽样方法可以较好地提高互联网个人信用评估模型的分类性能;构建信用等级较好用户的一般特质,即年龄在18~30岁之间、工资水平在2000元以上、用户页面浏览量多集中在10~20岁之间和申请贷款时间相对较早。在对互联网个人信用评估中变量有效性进行探索的基础上,反驳了“采用的变量越多结果就越准确”的说法。
互联网征信、不平衡样本、重抽样、随机森林
32
C812(统计方法)
全国统计科学重点研究课题《基于移动通信大数据的流动人口精细化挖掘研究》2015433;山西省高等学校创新人才支持计划资助项目晋教科〔2016〕3号
2017-03-29(万方平台首次上网日期,不代表论文的发表时间)
共7页
11-17