10.3969/j.issn.1671-0436.2005.05.005
数据流上挖掘决策树的的关键技术研究
分类是一个重要的数据挖掘问题,在数据流上挖掘决策树分类器的关键技术是如何计算最佳分裂标准,现有的算法有的不能很好地处理数值型的属性,有的计算代价太高.本文首先采用数据结构CML(Class Matrix List) 收集计算最佳分裂标准仅需的信息;其次,将数值型的属性值分成适当的区间,根据它们gini index 值的特殊性质,只需确定具有最大gini index 梯度的区间,因而可以快速地计算最佳分裂点,实现在流数据上快速建立决策树.
决策树、流数据、gini index 梯度、最佳分裂标准
18
TP301(计算技术、计算机技术)
2005-12-08(万方平台首次上网日期,不代表论文的发表时间)
共7页
19-25