10.3778/j.issn.1002-8331.2010.35.036
大数据集挖掘的层次二分抽样算法
针对目前关联规则挖掘的数据集不断增大,而很多抽样算法精度不高还要解决一系列NP难问题等情况.在分析利用频繁1项集进行抽样处理的基础上,提出了高精度的基于频繁n项集平均划分的关联规则挖掘算法--EHAC算法.理论和实验都表明,EHAC能够提高数据挖掘精度,在数据平均划分的同时,尽量保证频繁n项集能够平均划分,减少了数据库扫描次数,一定程度上缩减了数据库规模.
大数据集、关联规则挖掘、抽样算法、EHAC算法、准则系数
46
TP311(计算技术、计算机技术)
江苏省自然科学基金the Natural Science Foundation of Jiangsu Province of China under Grant No.8120003017
2011-03-21(万方平台首次上网日期,不代表论文的发表时间)
共3页
126-128