10.3969/j.issn.1002-137X.2002.10.017
大型事务数据库中的一种快速的规则挖掘算法
@@ 1引言
数据挖掘(Data Mining),也称为数据库中知识发现KDD,是指发掘隐藏在堆积如山的数据中的真知灼见,这基本上正在变成一种商业上非做不可的事情.关联规则[1](As-sociation Rules)是数据挖掘的重要研究内容,目前的绝大部分关联规则挖掘算法一般都分为两个阶段:①频繁项目集的发现;②规则的产生.算法的计算工作量主要集中在第一阶段上,因此,如何快速确定频繁项目集是算法效率的关键,在这方面已有许多工作与成果[2~6].但总的来讲,许多研究[2~6]都是在Apriori算法或其派生算法的基础上进行的.这些算法è或多或少存在如下两个问题:①算法必须耗费大量的时间处理规模巨大的候选项目集;②算法必须多次重复机械地扫描大型事务数据库,对候选项目集进行模式匹配.这两个问题是效据挖掘的难点也是热点,并已成为约束系统性能的瓶颈.
事务数据库、规则挖掘算法、Association Rules、频繁项目集、候选项目集、数据挖掘、关联规则、知识发现、系统性能、算法效率、模式匹配、快速确定、处理规模、工作量、商业、扫描、计算、基础、机械、耗费
29
TP31(计算技术、计算机技术)
国家自然科学基金79970092
2004-01-08(万方平台首次上网日期,不代表论文的发表时间)
共3页
59-60,69