10.3969/j.issn.1671-1815.2023.04.031
高维数据组合关联关系挖掘方法
针对经典挖掘算法挖掘效率低、主观性强、生成关联关系过多的问题,从样本筛选和关联规则生成两个方面提出一种面向高维数据关联规则挖掘的新型算法(mining multidimensional association rules by combination,Marc).所提算法通过计算样本的分布系数和删除阈值,综合自定义支持度在初读数据集时对样本进行双重筛选,在挖掘之初降低弱样本影响.在频繁项和关联规则生成时以样本关系表和样本全关系组合模式挖掘信息,降低挖掘过程的复杂性和资源消耗.试验结果表明:Marc算法挖掘出的频繁项和关联规则数量显著降低,在挖掘效率和内存消耗上均优于Apriori、FP-Growth和Eclat算法,且维度越高,数据集越大,优势越明显,Marc算法频繁项和关联关系挖掘的精度为100%.
关联规则挖掘(ARM)、数据挖掘、数据分析、数据筛选、大数据
23
TP393(计算技术、计算机技术)
国家自然科学基金;广西高校中青年教师科研基础能力提升项目
2023-03-24(万方平台首次上网日期,不代表论文的发表时间)
共10页
1615-1624