10.3321/j.issn:0254-4164.2006.04.015
关联规则挖掘的取样误差量化模型和快速估计算法
在关联规则挖掘过程中,现有的取样误差量化方法和快速估计算法存在着不足,对此提出了一种新的取样误差量化三元组模型,并在实验观察和理论分析的基础上给出了一种取样误差的快速估计算法--主误差区间估计法.理论分析和实验结果均表明,此方法不但可以精确、有效地度量出样本集与原始数据集包含的频繁模式信息间的差异,而且,主误差区间估计法还可以精确、快速地估计出取样误差,并能灵活地嵌入到关联规则挖掘的各种取样方法之中;其核心思想还可以用于改进分布、并行关联规则挖掘方法的效率.
关联规则、频繁项集、取样误差、主误差、PAC学习
29
TP311(计算技术、计算机技术)
科技部科研项目2001CCA03000;国家高技术研究发展计划863计划2001AAll3130;国家高技术研究发展计划863计划60496325;中国科学院智能科学项目
2006-04-25(万方平台首次上网日期,不代表论文的发表时间)
共10页
625-634