10.3969/j.issn.1002-137X.2004.z2.080
GARD:基于遗传算法的连续属性离散化
@@ 1引言
在现实世界中,描述事物属性的数据一般可以分为两种类型,一种是连续型,表示被描述对象的某些可测性质,其值取自某个连续的区间;另一种是离散型.离散型数据更加易于处理,并且简化了对知识的描述,可理解性强.许多现有的归纳学习系统如ID3、C4.5等都要求属性值数据是离散数据.因此,数据的离散化在数据挖掘和知识发现等领域具有重要的作用,一方面能使系统有效处理实际应用中经常遇到的连续属性值问题,另一方面,可以加快学习的速度和简化归纳获得的知识,甚至提高分类精度.目前,数据的离散化问题已经得到了广泛的研究.
基于遗传算法、属性离散化、Rough Set、数据挖掘、属性值、知识发现、描述对象、离散型、学习系统、实际应用、离散数据、可理解性、分类精度、处理、连续型、可测性、种类
31
TP3(计算技术、计算机技术)
2005-12-08(万方平台首次上网日期,不代表论文的发表时间)
共2页
217-218