挖掘数据流任意滑动时间窗口内频繁模式
由于数据流的流动性与连续性,数据流所蕴含的知识会随着时间的推移而发生变化.因此,在绝大多数数据流的应用中,用户往往对新产生的流数据所包含的知识要比对历史流数据所包含的知识感兴趣得多.提出了一种挖掘数据流任意大小滑动时间窗口内频繁模式的方法MSW(mining sliding window).当数据流流过时,该方法使用滑动窗口树SW-tree在单遍扫描流数据的条件下及时捕获数据流上最新的模式信息.同时,该方法还周期性地删除滑动窗口树上过期的及不频繁的模式分支,从而降低滑动窗口树的空间复杂度与维护代价.此外,该方法还应用时间衰减模型逐步降低历史事务模式支持数的权重,并由此来区分最近产生事务与历史事务的模式.大量仿真实验的结果表明,算法MSW具有较高的效率与优良的可扩展性,同时也优于其他同类算法.
数据流、频繁模式挖掘、滑动时间窗口、时间衰减模型
19
TP311(计算技术、计算机技术)
the National Natural Science Foundation of China under Grant No.60873030;the National High-Tech Research and Development Plan of China under Grant No.2007AA01Z300 国家高技术研究发展计划863
2008-12-15(万方平台首次上网日期,不代表论文的发表时间)
共12页
2585-2596