10.6040/j.issn.1671-7554.0.2024.0292
基于机器学习建立术前预测近端胃癌食管切缘阳性模型
目的 建立术前预测近端胃癌食管切缘阳性的机器学习模型,并比较其与传统Logistics模型的预测性能.方法 回顾性分析2013年1月至2022年12月于衡水市人民医院胃肠外科接受近端胃癌手术的382例患者的临床病理资料,根据食管切缘状态分为切缘阳性组(n=30)和切缘阴性组(n=352).将研究对象按2:1比例随机分为训练集(n=254)和测试集(n=128),采用合成少数样本过采样技术(synthetic minority oversampling technique,SMOTE)处理训练集中的不平衡数据,基于平衡后SMOTE数据集建立随机森林(random forest,RF)、支持向量机(support vector machine,SVM)和极端梯度提升(extreme gradient boosting,Xgboost)3 种机器学习模型及 Logistic 回归模型.通过上述4种模型,在测试集中预测食管切缘阳性时,利用受试者操作特征曲线下面积(area under curve,AUC)数值来比较不同模型的预测性能,对最佳预测模型中预测因素的重要性进行可视化排序.结果 4种模型的AUC值从高到低依次为 RF 模型 0.772(95%CI:0.620~0.925),SVM 模型 0.747(95%CI:0.604~0.891),Logistic回归模型0.716(95%CI:0.537~0.895)和 Xgboost 模型 0.710(95%CI:0.560~0.859).RF 模型预测性能最佳.肿瘤大小、肿瘤位置、Borrmann分型、Lauren分型及cT分期是RF模型中前5位重要因素.结论 所建立的术前预测近端胃癌食管切缘阳性的RF模型性能良好;肿瘤大小、肿瘤位置、Borrmann分型、Lauren分型及cT分期是主要的预测因素.
胃癌、进展期、切缘阳性、机器学习、预测模型
62
R735.2(肿瘤学)
河北省医学科学研究课题计划项目20230262
2024-09-19(万方平台首次上网日期,不代表论文的发表时间)
共6页
78-83