期刊专题

惩罚logistic回归用于高维变量选择的模拟评价

引用
目的 logistic回归是生物医学研究中常用的方法,可以进行影响因素筛选、概率预测、分类等.高通量测序技术得到的数据给高维变量选择问题带来挑战.惩罚logistic回归可以对高维数据进行变量选择和系数估计,且其有效的算法保证了计算的可行性.方法 本文介绍了常用的惩罚logistic算法如LASSO(least absolutes shrinkage and selection operator)、EN(elastic net)、SCAD(smoothly clipped absolute deviation)、MCP(minimax concave penalty)以及SIS(sure independence screening)等,并用模拟数据对各方法进行评价.结果 (1)各方法的结果与自变量间的相关程度有关,不同惩罚logistic回归的精确性与自变量间的相关程度有关,如果相关较高,LASSO或EN的结果较好,而在相关较低时,MCP或SCAD结果较好;(2)结合SIS的方法倾向于少选变量,误选率低,但敏感度也低,而LASSO、MCP、SCAD选择变量较多,误选率高,但敏感度较高;(3)当自变量间低度相关时,SIS的三种方法结果非常接近,但相关较高时,SIS+ LASSO的结果表现较好.结论 采用非小细胞型肺癌的基因数据集进行实例分析,并表明如何根据模拟实验的结论,在多种方法的不同结果间进行选择.

高维变量选择、惩罚logistic回归、LASSO、MCP、SCAD、SIS

33

I20;TP3

国家自然科学基金资助81473073;国家自然科学基金青年基金81502891

2016-10-11(万方平台首次上网日期,不代表论文的发表时间)

共5页

607-611

相关文献
评论
暂无封面信息
查看本期封面目录

中国卫生统计

1002-3674

21-1153/R

33

2016,33(4)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn