高维数据非参数密度估计的低维流形代表点法
非参数核方法由于采用统一的度量标准,在大数据中利用高维样本数据学习时容易遭遇维数灾难问题.挖掘高维空间中的低维几何特性,有助于揭示数据分布的流形结构,进而利用有限样本的高维数据在低维子空间逼近数据的真实分布.基于此,提出一种新的高维数据密度非参数估计的低维流形代表点法,通过从高维空间中挖掘数据分布的几何结构来估计密度.首先,通过寻找局部区域内能够代表流形结构主方向的点,计算局部协方差矩阵,描述局部的数据分布;然后,考虑流形结构中附近数据点不同的影响,根据每个样本数据点对密度的贡献进行加权.与传统的核密度估计方法和流形核密度方法进行了对比实验,结果表明,该方法能够快速稳健地进行密度估计,反映数据的真实分布.
低维流形代表点法、核密度估计、非参数密度估计、交叉似然验证、高维数据
46
P208(一般性问题)
国家重点研发计划;国家自然科学基金
2021-03-15(万方平台首次上网日期,不代表论文的发表时间)
共6页
65-70