10.3969/j.issn.1000-8152.2005.03.017
Web数据中频繁模式树的挖掘
为了高效地从半结构化WEB数据中挖掘频繁模式树,提出了把半结构化数据表示为标记、有序树,并基于最右路径扩展技术在有序树中发现所有频繁模式树的算法.其基本思想是,首先从只有一个节点的模式树开始,而新增节点只能通过添加到最右路径上来生成新的模式树,另外,还通过维护最右叶子出现次数列表来实现支持度的逐步计算.理论分析和试验结果表明该算法是可行的,并且具有计算性能线性于最大频繁模式总和的优点.
数据挖掘、Web数据、频繁模式树、有序树
22
TP311(计算技术、计算机技术)
国家高技术研究发展计划863计划2003AA1Z2610
2005-08-04(万方平台首次上网日期,不代表论文的发表时间)
共5页
429-433