基于高斯函数的衰减因子设置方法研究
数据流是随着时间顺序快速变化的和连续的,其包含的知识会随着时间的改变而不同。在一些数据流应用中,通常认为最新的数据具有最大的价值。因此,会采用时间衰减模型来挖掘数据流中的频繁模式。已有的衰减因子设计方式通常具有随机性,使得到的结果集具有不稳定性;或仅考虑算法的高查全率或查准率,而忽略了算法对应的高查准率或查全率。为了平衡算法的高查全率和高查准率同时保证结果集的稳定性,设计了均值衰减因子设置方式。为了更进一步地增加最新事务的权重、减少历史事务的权重,设计了采用高斯函数设置高斯衰减因子的方式。为了比较不同衰减因子设计方式的优劣,研究并设计了4种方式的时间衰减模型,并采用这4种模型挖掘数据流闭合频繁模式。通过对高密度和低密度数据流分别进行频繁挖掘的实验结果分析可以得出,采用均值衰减因子设置方式可以平衡高查全率和高查准率;采用高斯衰减因子设置方式与其他方法相比,可以得到更优的算法性能。
衰减因子、时间衰减模型、高斯函数、查全率、查准率、频繁模式挖掘、数据流挖掘
TP18(自动化基础理论)
国家自然科学基金项目61563001;国家民委科研基金项目14BFZ008;北京市自然科学基金项目4142042;北方民族大学科研基金项目2013QZP02
2016-03-18(万方平台首次上网日期,不代表论文的发表时间)
共10页
2834-2843