10.3321/j.issn:1671-5489.2005.06.011
快速频繁序列模式挖掘算法
为解决从数据库中挖掘长模式可能遇到较高的计算复杂度问题,提出一种新的算法FFSPAN.传统上,要判断一个序列是否频繁,需要在原数据库中判断整个序列是否频繁;而算法FFSPAN是通过在序列数据库中寻找一个频繁项或一个频繁项集来代替寻找一个完整的频繁序列,而且FFSPAN算法每次扫描的数据库都是迅速减小的,这使得算法在挖掘的序列模式越长时越有效.在标准测试数据集上的实验结果表明,FFSPAN算法非常有效.
序列模式、长模式、深度优先、数据挖掘
43
TP31(计算技术、计算机技术)
国家高技术研究发展计划863计划60433020;教育部重点实验室基金
2005-12-15(万方平台首次上网日期,不代表论文的发表时间)
共5页
768-772