10.3778/j.issn.1002-8331.2008.18.012
连续属性离散化的Bayesian-Chi2算法
连续属性离散化在机器学习和数据挖掘领域中有着重要的作用.连续属性离散化方法是否合理决定着对信息的表达和提取的准确性.Chi2算法在对连续属性进行离散化处理时,无冲突的数据能够得到较好的结果,但是,对不协调和不完全的数据实验结果不是很理想.利用了Bayseian模型允许一定程度错误分类存在的性质,对Chi2算法进行了改进.改进后的Chi2算法不仅更适合不协调和不完全的数据.还使得区间的合并更加合理.实验结果证明了算法的有效性.
连续属性离散化、Chi2算法、贝叶斯
44
TP18(自动化基础理论)
国家自然科学基金60372071;辽宁省教育厅资助项目2004C031;辽宁师范大学校科研和教改项目
2008-08-13(万方平台首次上网日期,不代表论文的发表时间)
共3页
39-40,43