10.3969/j.issn.1001-9146.2006.01.005
基于数据分区的连续属性整体离散化方法研究
实际问题中经常涉及连续的数值属性,然而许多归纳学习算法却是针对离散属性空间的.因此,对数据进行预处理的离散化算法一直受到人们的重视.兼顾所有属性间关系的整体离散化是一个重要方法,该文提出基于数据分区的整体离散化算法,它首先对例子集合在各个连续属性上的取值进行统一的放大处理,选出包含最多聚类信息的属性,将整个例子集合粗略的划分为多个分区;然后在各个分区中分别进行聚类、合并.该方法改进了基本的整体离散化算法,并利用农业专家系统中的土壤分类数据对算法进行了验证.
归纳学习、离散化、数据分区、整体离散化
26
TP181(自动化基础理论)
2006-05-18(万方平台首次上网日期,不代表论文的发表时间)
共4页
18-21