10.13481/j.1671-587X.202404019
基于心脑血管疾病发病风险预测的CatBoost算法和贝叶斯网络模型分析
目的:筛选影响心脑血管疾病发病的主要特征变量,基于排序前10位的特征变量构建心脑血管疾病发病风险贝叶斯网络模型,为心脑血管疾病发病风险预测提供参考.方法:从英国生物样本(UK Biobank)数据库中纳入315 896例参与者和相关变量,通过类别型特征提升(CatBoost)算法进行特征选择,将所有参与者按7∶3比例随机分为训练集和测试集,并基于最大最小爬山(MMHC)算法构建贝叶斯网络模型.结果:本研究中人群心脑血管疾病患病率为28.8%.CatBoost算法筛选的排名前10位变量分别为年龄、体质量指数(BMI)、低密度脂蛋白胆固醇(LDL-C)、总胆固醇(TC)、甘油三酯-葡萄糖(TyG)指数、家族史、载脂蛋白A/B比值、高密度脂蛋白胆固醇(HDL-C)、吸烟状态和性别.CatBoost训练集模型受试者工作特征(ROC)曲线下面积(AUC)为0.770,模型准确性为0.764;验证集模型AUC为0.759,模型准确性为0.763.临床效能分析,训练集阈值范围为0.06~0.85,验证集阈值范围为0.09~0.81.心脑血管疾病发病风险贝叶斯网络模型分析,年龄、性别、吸烟状态、家族史、BMI和载脂蛋白A/B比值与心脑血管疾病直接相关,是心脑血管疾病发生的重要风险因素,TyG指数、HDL-C、LDL-C和TC通过影响BMI和载脂蛋白A/B比值间接影响心脑血管疾病的发生风险.结论:控制BMI、载脂蛋白A/B比值和吸烟行为,可以降低心脑血管疾病的发病风险.贝叶斯网络模型可用于预测心脑血管疾病发病风险.
心脑血管疾病、CatBoost算法、贝叶斯网络、风险推理
50
R54;R743(心脏、血管(循环系)疾病)
国家自然科学基金;国家自然科学基金;国家自然科学基金;国家统计局科研项目;山东省科技厅自然科学基金项目;山东省科技厅自然科学基金项目;山东省科技厅自然科学基金项目;山东省教育厅高等学校青创人才引育计划项目;潍坊医学院博士启动基金
2024-08-25(万方平台首次上网日期,不代表论文的发表时间)
共11页
1044-1054