10.20116/j.issn2095-0616.2023.15.33
基于机器学习算法的前列腺癌疾病诊断标志物筛选分析
目的 通过机器学习算法模型对前列腺癌的良恶性风险进行预测并对其关联因素进行分析.方法 采用kaggle前列腺癌公开数据集诊断数据100例,其中良性62例、恶性38例.按照7∶3划分训练集与测试集,采用机器学习算法构建预测模型并进行验证和特征权重重要性分析与SHAP模型解释性分析.结果 几种机器学习算法模型的评价中采用了准确率、精确率、F1分数、召回率等指标.最终Catboost模型预测效果最好,准确率达92%,ROC-AUC为96%,召回率为1,精确率为0.67,F1分数为0.8.密实度(compactness)、前列腺癌病灶的面积(area)为影响诊断结果的最重要的两个因素.结论 利用机器学习算法预测前列腺癌疾病风险,可揭示前列腺癌诊断标志物与解释模型,为临床辅助诊断决策提供参考.
前列腺癌、疾病风险、机器学习、特征重要性、模型
13
R737.25(肿瘤学)
黑龙江省省属高校科研基本业务费科研项目2021-KYYWF-0508
2023-09-18(万方平台首次上网日期,不代表论文的发表时间)
共5页
136-140