10.3778/j.issn.1002-8331.1106-0009
MDL理论的多属性值域划分方法
连续属性值域划分方法是数据挖掘和机器学习领域的重要课题.但已有的大量离散化方法倾向于研究一维属性离散化问题,没有考虑多属性之间的相互关系,难于获得最佳的离散化结果.提出一种基于最小描述长度理论的多属性划分方法,通过定义多属性的模型选择问题,推导出多属性划分衡量函数;设计一种合理的算法来寻找最好的离散化结果.性能评价与分析表明,该方法在Naive贝叶斯分类器上有很好的分类学习能力.
数据挖掘、离散化、最小描述长度理论、Naive贝叶斯
49
TP18(自动化基础理论)
金陵科技学院自然科学基金208.40410826;金陵科技学院博士启动基金JIT-B-01
2013-03-13(万方平台首次上网日期,不代表论文的发表时间)
共5页
167-170,198