数据挖掘取样方法研究
取样是一种通用有效的近似技术.在数据挖掘研究中,取样方法可显著减小所处理数据集的规模,使得众多数据挖掘算法得以应用到大规模数据集以及数据流数据上.通过对应用于数据挖掘领域的代表性取样方法的比较研究和分析总结,提出了一个取样算法分类框架.在指出了均匀取样局限性的基础上阐述了某些应用场景中选用偏倚取样方法的必要性,综述了取样技术在数据挖掘领域的应用研究与应用发展,最后对数据流挖掘取样方法面临的挑战和发展方向进行了展望.
数据挖掘、均匀取样、偏倚取样、数据流、概要数据结构
48
TP311.13;TP391(计算技术、计算机技术)
国家自然科学基金项目60873176;福建省教育厅科技项目JA08161
2011-05-04(万方平台首次上网日期,不代表论文的发表时间)
共10页
45-54