期刊专题

10.13481/j.1671-587X.202404019

基于心脑血管疾病发病风险预测的CatBoost算法和贝叶斯网络模型分析

引用
目的:筛选影响心脑血管疾病发病的主要特征变量,基于排序前10位的特征变量构建心脑血管疾病发病风险贝叶斯网络模型,为心脑血管疾病发病风险预测提供参考.方法:从英国生物样本(UK Biobank)数据库中纳入315 896例参与者和相关变量,通过类别型特征提升(CatBoost)算法进行特征选择,将所有参与者按7∶3比例随机分为训练集和测试集,并基于最大最小爬山(MMHC)算法构建贝叶斯网络模型.结果:本研究中人群心脑血管疾病患病率为28.8%.CatBoost算法筛选的排名前10位变量分别为年龄、体质量指数(BMI)、低密度脂蛋白胆固醇(LDL-C)、总胆固醇(TC)、甘油三酯-葡萄糖(TyG)指数、家族史、载脂蛋白A/B比值、高密度脂蛋白胆固醇(HDL-C)、吸烟状态和性别.CatBoost训练集模型受试者工作特征(ROC)曲线下面积(AUC)为0.770,模型准确性为0.764;验证集模型AUC为0.759,模型准确性为0.763.临床效能分析,训练集阈值范围为0.06~0.85,验证集阈值范围为0.09~0.81.心脑血管疾病发病风险贝叶斯网络模型分析,年龄、性别、吸烟状态、家族史、BMI和载脂蛋白A/B比值与心脑血管疾病直接相关,是心脑血管疾病发生的重要风险因素,TyG指数、HDL-C、LDL-C和TC通过影响BMI和载脂蛋白A/B比值间接影响心脑血管疾病的发生风险.结论:控制BMI、载脂蛋白A/B比值和吸烟行为,可以降低心脑血管疾病的发病风险.贝叶斯网络模型可用于预测心脑血管疾病发病风险.

心脑血管疾病、CatBoost算法、贝叶斯网络、风险推理

50

R54;R743(心脏、血管(循环系)疾病)

国家自然科学基金;国家自然科学基金;国家自然科学基金;国家统计局科研项目;山东省科技厅自然科学基金项目;山东省科技厅自然科学基金项目;山东省科技厅自然科学基金项目;山东省教育厅高等学校青创人才引育计划项目;潍坊医学院博士启动基金

2024-08-25(万方平台首次上网日期,不代表论文的发表时间)

共11页

1044-1054

相关文献
评论
暂无封面信息
查看本期封面目录

吉林大学学报(医学版)

1671-587X

22-1342/R

50

2024,50(4)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn