10.3969/j.issn.2095-2163.2019.02.023
面向脏数据的贝叶斯统计建模研究
为了处理贝叶斯建模中的脏数据,通常会有2种解决方法.一种是对整个数据集进行清洗,但这种方法的代价很高,且对中型或大型的数据集可行性较低.另一种是使用点估计,这种点估计的方法虽然能有效减少清洗的代价,但是对训练出来贝叶斯模型的可信程度没有保证.针对上述清洗方法中存在的问题,本文提出了一种基于区间的贝叶斯统计建模方法,简称区间贝叶斯建模.区间贝叶斯建模结合中心极限定理,使用区间估计的方法,保证了真实的后验概率会以一定的概率落在后验概率区间内.实验结果表明,区间贝叶斯建模通过清洗少量的样本,便能够训练出良好的贝叶斯模型,有效改善了清洗成本,并在精度和召回率上比不清洗任何数据的情况有显著的提升.
贝叶斯分类器、数据清洗、概率区间、区间比较策略
9
TP181(自动化基础理论)
2019-03-18(万方平台首次上网日期,不代表论文的发表时间)
共5页
104-107,111