10.11896/j.issn.1002-137X.2017.07.030
一种基于数据流模式表示的半懒惰式分类算法
依据从大规模数据中抽取的模式来建立分类模型是模式挖掘的重要研究问题之一.一种可行的方法是根据模式集合建立贝叶斯分类模型.然而,目前基于模式的贝叶斯分类模型大多是针对静态数据集合的,通常不能适应于高速动态变化与无限的数据流环境.对此,提出一种数据流环境下基于模式发现的贝叶斯分类学习模型,其采用半懒惰式学习策略,针对分类实例在不断更新的频繁项集合上建立局部的分类模型;为加快流数据处理的速度,提出了结构更为简单的混合树结构,同时提出了给定项限制的模式抽取机制以减少候选项集的生成;对数据流中模式抽取不完全的情况,使用平滑技术处理未被抽取的项.大量实验分析证明,相较于其他数据流分类器,所提模型具有更高的分类正确率.
数据流、频繁模式、贝叶斯、半懒惰式学习
44
TP311(计算技术、计算机技术)
国家自然科学基金61672086;北京市自然科学基金4142042
2017-08-14(万方平台首次上网日期,不代表论文的发表时间)
共9页
167-174,202