利用粒计算的符号型数据分组算法
在数据挖掘领域,基于符号型数据分组的数据预处理是一个极富挑战性的问题,它给人们提供了一种更加简化的数据表现形式.在已往的研究中,相关学者提出了许多解决方案,例如,运用粗糙集的方法来解决这一问题.文中提出了一种基于粒计算的符号型数据分组算法,主要分为粒度生成和粒度选择两个阶段.在粒度生成阶段,对于每一条属性,以对应属性值的聚类为叶子节点,自底向上以二进制树的形式构建粒层,形成属性树森林.在粒度选择阶段,以信息增益为基础,对每棵树进行全局考虑,选取最优的粒层,选层结果就是符号型数据的分组结果.实验结果表明,本算法呈现出比已有算法更加平衡的层次结构和更加优秀的压缩效率,具有较好的应用价值.
粒计算、信息增益、符号型、数据分组
45
TP311(计算技术、计算机技术)
2018-12-18(万方平台首次上网日期,不代表论文的发表时间)
共8页
445-452