10.11675/j.issn.0253-4304.2020.06.17
随机森林模型和Logistic回归模型在高尿酸血症预测中的应用效果比较
目的 比较随机森林模型和Logistic回归模型在体检人群高尿酸血症预测中的应用效果.方法 选取2 754例体检个体作为研究对象,运用随机森林模型和Logistic回归模型建立高尿酸血症预测模型,采用受试者工作特征曲线下面积评价两种模型的预测效能.结果 随机森林模型特征变量的重要性分析结果显示,排名前5位的变量依次是血肌酐、三酰甘油、腰围、体质指数、尿素氮;随机森林预测模型的曲线下面积为0.759(95% CI:0.746~0.772),灵敏度为97.2%,特异度为54.5%.Logistic回归分析结果显示,性别、腰围、体质指数、三酰甘油、血肌酐是高尿酸血症发生的影响因素(均P <0.05);Logistic回归预测模型的曲线下面积为0.658(95% CI:0.647~0.669),灵敏度为87.7%,特异度为43.9%.随机森林预测模型曲线下面积优于Logistic回归模型(P<0.05).结论 Logistic回归模型可直观解释变量对疾病发生的风险度;而随机森林模型对高尿酸血症预测效果较好,可获得各个因素的重要性评分,可以作为Logistic回归预测模型的补充.
高尿酸血症、随机森林模型、Logistic回归模型、预测模型
42
R589.7(内分泌腺疾病及代谢病)
2020-06-28(万方平台首次上网日期,不代表论文的发表时间)
共5页
729-733