10.3969/j.issn.1672-6944.2022.08.053
一种优化权重的k-近邻填补缺失值的算法研究
传统k近邻填补算法中k个最近邻数据的权重分布不稳定且忽略了属性相关性,针对此问题,文章提出了一种基于k近邻填补算法的优化算法,在基于三阶明考夫斯基距离的基础上,对k个近邻数据采用了基于熵权法的权重系数,然后利用PCA算法原理考虑相关属性影响,得到属性影响因子.最终的填补值即为优化权重后的k-近邻填补算法与最后影响因子的和.构造缺失后,能有效得到填补值.实证表明,改进后的算法均方根误差为0.25,填补值最接近真实值,优于传统的k-近邻填补算法(均方根误差0.44)和普通加权的k-近邻填补算法(均方根误差为0.30).
k-近邻填补算法、熵权法、主成分分析、缺失数据
19
TP391.9;O212.1;TP181
2022-06-28(万方平台首次上网日期,不代表论文的发表时间)
共5页
121-125