10.3969/j.issn.1673-808X.2009.06.008
一种实时有效的AECFP数据流频繁项挖掘算法
由于数据流的高速产生性、强流动性及变化不稳定性的需求,数据流算法应在有限存储空间里实时准确分析数据,提取有用知识.在允许的误差范围内,提出一种有效的数据流频繁项挖掘算法AECFP,通过一种基于频繁项样本的数据结构记录抵达的项目集合,进行快速的保存样本,并在样本空间满时快速删除出现次数最小且最旧的非频繁项,保留相同支持数的其它频繁项.当用户查询频繁项时,快速实时准确挖掘数据流中的频繁项,适应数据波动变化.经过实验证明,该算法在挖掘频繁项时,具有快速的处理能力,满足空间消耗的低存储要求,并能保证数据频繁项的挖掘准确度.
数据流、数据挖掘、频繁项、ε-近似、非频繁项
29
TP311(计算技术、计算机技术)
2010-04-09(万方平台首次上网日期,不代表论文的发表时间)
共3页
480-482