10.16381/j.cnki.issn1003-207x.2018.11.019
代价敏感的目标客户选择半监督集成模型研究
在现实的目标客户选择建模中,往往只能获取少量有类别标签的样本,而剩下的大量样本都无法获取类别标签.已有研究大都使用监督式建模研究范式,仅在少量有类别标签样本集上建模,很难取得令人满意的效果.为解决这一问题,本文引入半监督学习(semi-supervised learning,SSL)技术,将其与代价敏感学习(cost sensitivelearning,CSL)和多分类器集成中的随机子空间(random subspace,RSS)方法相结合,提出了代价敏感的目标客户选择半监督集成模型(cost-sensitive semi-supervised ensemble model,CSSE).该模型使用代价敏感的支持向量机(SVM)来解决目标客户选择建模中样本数据类别分布不平衡的问题,还能够同时使用有、无类别标签的客户样本来建模.进一步地,该模型利用RSS方法训练一系列基本分类模型,并通过集成得到最终的分类结果.在某保险公司目标客户选择数据集上进行实证分析,结果表明,与两种监督式集成模型、两种单一的半监督模型以及两种半监督集成模型相比,CSSE模型具有更好的目标客户选择性能.
目标客户选择、代价敏感、半监督学习、RSS集成方法、半监督集成
26
TP18;F270(自动化基础理论)
国家社科基金重大专项资助项目18VZL006;国家自然科学基金资助项目71471124,71273036;四川大学杰出青年基金资助项目sksyl201709;四川大学哲学社会科学青年学术人才基金项目skqx201607
2019-01-04(万方平台首次上网日期,不代表论文的发表时间)
共11页
186-196