10.3969/j.issn.1001-7119.2014.06.033
基于中位分割碎片合并的特征挖掘云平台设计
为有效精确地挖掘海量数据流特征,提出采用数据集中位分割和冗余数据碎片合并的方法设计决策树并构建云平台数据特征挖掘模型。传统的云平台下数据挖掘中对碎片信息不做处理,使文本碎片成几何级增长,导致有用信息的丢失。通过挖掘冗余信息中符合挖掘条件的碎片特征,使用KD树进行数据挖掘索引,在迭代过程中,对数据进行层进中位分割,并结合碎片合并技术,构建数据挖掘云平台模型,对中位数进行维度匹配分箱,使数据的挖掘和传输率最大限度地得到利用。仿真实验证明了采用碎片合并的方法能有效提取冗余碎片中的有用特征信息,数据挖掘性能得到大幅度提升,在数据信息提取和管理中具有很好的推广意义。
中位分割、碎片合并、特征挖掘、云平台
TP392(计算技术、计算机技术)
国家自然科学基金项目61364020;校级青年课题重点项目2012YJQN06。
2014-07-09(万方平台首次上网日期,不代表论文的发表时间)
共3页
97-99