缺失森林算法在缺失值填补中的应用
目的 介绍R环境下缺失森林算法在缺失值填补中的应用并评价其填补效果.方法 通过实际数据阐述填补估算流程,比较缺失森林算法与直接删除法处理缺失数据的效果.结果 当数据缺失率为10%时,缺失森林算法填补的效果明显优于删除法;当数据缺失率在20%时,两种方法处理缺失值的效果都不太理想,效果相近.当缺失率达50%时,3种类型的变量估算的误差已经较大,两种方法的估算效果均欠佳.结论 缺失森林算法在软件操作上简便,并且对数据结构和分布的要求宽松,可充分利用现有记录的信息,能较为准确地反应调查的真实情况,在实际工作中具有较好的应用价值.
缺失森林、随机森林、决策树、缺失值
31
TP3;TS9
2016-07-22(万方平台首次上网日期,不代表论文的发表时间)
共3页
774-776