10.3321/j.issn:1002-8331.2005.21.055
基于增益得分的噪声发现算法
在现实数据集中不可避免地存在噪声,如何检测并去除噪声是数据挖掘中的一项重要研究内容.本文提出了一种基于增益的得分算法来检测噪声.为了检验该算法的有效性,以决策树为工具.在产生决策树之前,先用该算法去除训练集中的噪声,以免噪声导致决策树过大和过度拟合.对12个UCI数据集利用该算法去噪,再用C4.5生成决策树,实验结果表明,与不去噪时生成的决策树相比,改善了分类精度,且树尺寸明显减小.
机器学习、决策树、噪声
41
TP181(自动化基础理论)
国家自然科学基金6037500
2005-09-15(万方平台首次上网日期,不代表论文的发表时间)
共4页
186-188,205