一种基于大项集重用的序列模式挖掘算法
在重新定义序列模式的长度、增加了序列模式的挖掘粒度的基础上,提出一种基于大项集重用的序列模式挖掘算法HVSM.该算法采用垂直位图法表示数据库,先横向扩展项集,将挖掘出的所有大项集组成一大序列项集,再纵向扩展序列,将每个一大序列项集作为"集成块",在挖掘k大序列时重用大项集.并以兄弟节点为种子生成候选大序列,利用1st-TID对支持度进行计数.实验表明,对于大规模事务数据库,该算法有效地提高了挖掘效率.
序列模式挖掘、位图表示法、项集扩展、序列扩展
43
TP311(计算技术、计算机技术)
中国科学院资助项目60573136;国家科技攻关项目2003AA142010
2006-03-23(万方平台首次上网日期,不代表论文的发表时间)
共7页
68-74