期刊专题

10.3969/j.issn.1002-3674.2022.06.010

控制混杂因素的基于随机森林方法评价

引用
目的 在高维组学研究中,混杂因素常常影响着随机森林筛选出与研究结局相关联的变量的能力,因此控制混杂因素具有非常重要的作用.方法 通过模拟试验和实例验证,我们比较了以下四种方法在筛选与研究结局相关联的变量中控制混杂因素的效果:随机森林(random forest,RF);Ranger法;加权Ranger,给予每个混杂因素以100%的权重;残差法,将去除混杂因素的因变量和自变量作为新的因变量和自变量纳入Ranger分析.研究采用危险因素在重要性评分排序中排在第一位的比例作为评价指标.结果 基于大量的模拟试验,我们发现残差法和加权Ranger法有效提高了危险因素在重要性评分排序中排在第一位的比例.GWAS实例证实,在使用这两种方法校正混杂因素之后,危险因素的排序有所提前.结论 校正混杂因素对于筛选与研究结局相关联的变量十分必要,且残差法在混杂因素校正上表现优于加权Ranger法,RF和Ranger几乎无混杂校正作用.

混杂、随机森林、ranger、加权、重要性评分

39

R195.1(保健组织与事业(卫生事业管理))

国家重点研发计划;国家自然科学基金;江苏省中医院院级创新发展基金专项课题

2023-02-22(万方平台首次上网日期,不代表论文的发表时间)

共6页

844-849

相关文献
评论
暂无封面信息
查看本期封面目录

中国卫生统计

1002-3674

21-1153/R

39

2022,39(6)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn