样本残缺状态下数据处理方法的研究
由于人为疏忽或设备限制等多种原因,现实中的数据在收集过程中表达的信息不完整,残缺样本给数据挖掘和决策造成不便.为了得到理想的完整数据集,需要处理、填补数据集,使其成为完整数据集.针对数据残缺的不同机制和填补方法,分析各自方法的适用场景,从而总结、比较不同方法的填补效果.结果 表明,残缺率越大填补效果越差,随机填补方法的稳定性较差,回归填补方法的效果更好.
均值填补、随机填补、EM填补、回归填补
TP181(自动化基础理论)
西安培华学院校级课题资助PHKT18055
2019-11-20(万方平台首次上网日期,不代表论文的发表时间)
共3页
157-158,164