10.11925/infotech.2096-3467.2020.1185
前列腺癌预测模型对比研究
[目的]对比基于集成学习算法与非集成学习算法构建的前列腺癌预测模型性能,选出最优算法和重要风险因素.[方法]基于KNN、决策树、支持向量机、BP神经网络4种非集成算法和AdaBoost、GradientBoost、XGBoost三种集成算法构建前列腺癌预测模型并验证模型效能,识别前列腺癌风险因素.[结果]非集成算法中决策树模型性能最优,准确率为0.9333,F1分数为0.9301,AUC为0.9145;集成算法中XGBoost模型性能最优,准确率为0.9573,F1分数为0.9624,AUC为0.9513.识别出总PSA、游离PSA等9个前列腺癌重要风险因素.[局限]实验数据集有待扩充,构建模型的算法有待增加.[结论]在前列腺癌预测模型性能和风险因素识别方面,集成学习算法整体上优于非集成学习算法.
集成学习;机器学习;前列腺癌;预测模型
5
TP391(计算技术、计算机技术)
本文系吉林大学博士研究生交叉学科科研资助计划项目编号:101832020DJX081
2021-12-28(万方平台首次上网日期,不代表论文的发表时间)
共8页
107-114