期刊专题

10.11925/infotech.2096-3467.2017.0544

基于关联分类算法的PU学习研究

引用
[目的]基于常用的关联分类算法CBA进行PU学习研究.[方法]将训练集中比例为α的正样本作为未被识别出的正样本,与负样本一起组成未标记样本集,从而构建PU学习场景.其中,基于全部正类别分类关联规则对样本进行分类,并使用分类关联规则相对置信度衡量分类关联规则分类结果的可信度.[结果]当α取值分别为0、0.3、0.6、0.9时,在实验数据集上,本文方法的分类结果的AUC值较CBA算法分别平均提高6.21%、11.15%、13.50%、16.56%,较POSC4.5算法分别平均提高11.27%、15.03%、12.22%、7.37%.[局限]由于未对全部样本中真实正样本所占的比例进行估计,并据此对分类关联规则的置信度进行修正,因而所提方法的分类效果随α取值的增长呈下降趋势.此外,CBA算法会产生大量的冗余规则,而本文并未对其中的规则进行筛选.[结论]本文方法在PU学习场景中的分类效果优于CBA算法和POSC4.5算法.

关联分类、PU学习、CBA算法

TP311;G35(计算技术、计算机技术)

2017-12-18(万方平台首次上网日期,不代表论文的发表时间)

共7页

12-18

暂无封面信息
查看本期封面目录

数据分析与知识发现

1003-3513

11-2856/G2

2017,(11)

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn