10.3969/j.issn.1002-137X.2004.10.041
缺失数据处理方法的比较研究
数据挖掘已被广泛用于医疗领域,而大多数医疗数据集都存在缺失值.本文介绍了一些缺失值估计算法.建立了5种模型来提高预测的有效性,它们是保留缺失模型、直接丢弃模型、贝叶斯补缺模型、贝叶斯重叠补缺模型和基于信息增益的贝叶斯重叠补缺模型.这些模型在Clinics数据集上进行了处理和分析.用C4.5决策树和10叠交叉确认法来检验这些模型的性能,结果表明根据信息增益递减顺序排序,用朴素贝叶斯分类器来预测缺失值是有效的.
数据挖掘、缺失值、朴素贝叶斯分类器、信息增益
31
TP3(计算技术、计算机技术)
国家"211"工程建设项目2004
2004-11-11(万方平台首次上网日期,不代表论文的发表时间)
共3页
155-156,174