二分类数据缺失多重填补分析及应用
目的 阐明四种填补方法(multiple imputation,MI)的基本原理,实例介绍纵向研究二分类缺失数据多种填补方法的应用.方法 对比分析简单填补、分层填补、考虑个体差异的填补及考虑个体、抽样的多重填补等四种填补方法;模拟证实几种OR取值的敏感性分析.结果 进行大样本(N=10000)模拟研究表明:简单多重填补分析会降低检验效能,不能客观反应两样本的差异;考虑先前信息的分层多重填补会扩大Ⅰ型错误;若只考虑个体变异,仅模拟一个数据集,所得结论不稳定;在考虑个体、抽样和填补差异后模拟的多重填补数据集,当OR≈2时,所得统计量基本接近真值;实例验证,经高血压知晓干预后,尚不能认为两区的吸烟率有差别.结论 不考虑前次观察数据以及OR值的影响,一味地把缺失值当作该事件发生处理,会加大Ⅰ型错误;只有综合考虑个体、抽样和填补差异,多重填补数据集的估计结果才更具稳健性.
多重填补、纵向研究、二分类数据缺失、效果评价
31
TP2;R19
国家自然科学基金项目编号81172774;国家青年科学基金项目资助81001294;太原市大学生创新创业专题120164023
2016-07-22(万方平台首次上网日期,不代表论文的发表时间)
共4页
370-373