10.11925/infotech.2096-3467.2017.0544
基于关联分类算法的PU学习研究
[目的]基于常用的关联分类算法CBA进行PU学习研究.[方法]将训练集中比例为α的正样本作为未被识别出的正样本,与负样本一起组成未标记样本集,从而构建PU学习场景.其中,基于全部正类别分类关联规则对样本进行分类,并使用分类关联规则相对置信度衡量分类关联规则分类结果的可信度.[结果]当α取值分别为0、0.3、0.6、0.9时,在实验数据集上,本文方法的分类结果的AUC值较CBA算法分别平均提高6.21%、11.15%、13.50%、16.56%,较POSC4.5算法分别平均提高11.27%、15.03%、12.22%、7.37%.[局限]由于未对全部样本中真实正样本所占的比例进行估计,并据此对分类关联规则的置信度进行修正,因而所提方法的分类效果随α取值的增长呈下降趋势.此外,CBA算法会产生大量的冗余规则,而本文并未对其中的规则进行筛选.[结论]本文方法在PU学习场景中的分类效果优于CBA算法和POSC4.5算法.
关联分类、PU学习、CBA算法
TP311;G35(计算技术、计算机技术)
2017-12-18(万方平台首次上网日期,不代表论文的发表时间)
共7页
12-18