期刊专题

10.16157/j.issn.0258-7998.190773

一种改进的基于PCA的数据预处理方法

引用
大数据处理项目中,数据预处理工作量要占资源消耗的60%左右,而数据规约是影响大型数据集预处理效果的主要瓶颈.主成分分析(PCA)是目前使用最广泛的数据维规约算法.使用PCA方法时要关注生成的协方差矩阵质量和特征值的选取数量.改进的PCA算法将均值计算转变为加权规范平均值计算完成中心化数据,通过Rayleigh商和Cattell碎石检验原则选择更合理的特征值数目.算法验证实验结果表明,在数据准确、完整的首要要求下,改进后的PCA算法得到的主成分能解释超过90%的原变量,但可能会牺牲部分维规约效率.

PCA、数据预处理、数据规约

46

TN919;TP391

2019年度市科技局贵阳学院科技专项GYU-KYZ2019-2020PT06-02;教育部青年基金项目18YJCZH016

2020-04-10(万方平台首次上网日期,不代表论文的发表时间)

共4页

96-99

暂无封面信息
查看本期封面目录

电子技术应用

0258-7998

11-2305/TN

46

2020,46(1)

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn