10.3778/j.issn.1002-8331.2012.04.036
数据流中基于滑动窗口的序列模式挖掘算法
序列模式发现是最重要的数据挖掘任务之一,并有着广阔的应用前景.针对静态数据库,序列模式挖掘已经被深入地研究,但针对基于数据流的序列模式挖掘的研究还不是十分深入.数据流有着无限性的特性,因此往往不能保存数据流中全部的数据,同时很多时候只对最近的时间段的序列模式感兴趣,提出一个有效的结合滑动窗口技术的挖掘序列模式的算法FPM-SW,算法利用到3个数据结构(PatternTable,CountTable和Ta-tree)来处理基于数据流的序列模式挖掘的复杂性问题.算法通过CountTable结构来保存以往的潜在频繁序列,考虑到在某些情况下CountTable占用内存过多,算法还结合了一种压缩CountTable技术来减少内存占用.FPM-SW的优点是可以最大限度地降低负正例的产生,实验表明FPM-SW具有较高的准确率.
序列模式、数据流挖掘、滑动窗口
48
TP391(计算技术、计算机技术)
2012-04-27(万方平台首次上网日期,不代表论文的发表时间)
共5页
121-124,166