10.3980/j.issn.1672-5123.2021.9.31
基于机器学习算法的干眼预测模型研究
目的:通过对干眼患者临床数据进行数据挖掘分析建立干眼的预测模型.方法:收集2020-03/2021-01于我院就诊的干眼患者218例436眼纳入干眼组,健康体检无干眼人群212例424眼纳入正常对照组.两组受试者均接受泪液分泌试验(SⅠt)、荧光素染色泪膜破裂时间(FBUT)、非接触式泪膜破裂时间(NI-BUT)、泪河高度(TMH)、角膜荧光素钠染色(FL)、睑板腺功能评分(MG-SCORE)检查.分别从干眼组和正常对照组随机抽取100例200眼数据组成测试集,其余干眼组118例236眼和正常对照组112例224眼数据作为训练集.采用CFS(correlation feature searching)特征筛选算法筛选与干眼检测有关的强相关影响因素,分别采用C4.5决策树、Rondom Forest、Rondom Tree、Na?ve Bayes、KNN、SVM、Decision Stump和Bagging机器学习方法构建干眼预测模型,并对其进行单因子变量分析.结果:通过CFS特征筛选算法得到SⅠt、NI-BUT、TMH和FL评分4个指标作为特征变量.基于该4个特征变量,采用8种机器学习算法构建模型的总预测准确率均高于75%,其中Random Forest模型的预测准确率最高,对干眼组和正常对照组的预测准确率分别达91.8%和88.3%,总预测准确率达90.1%.单因素建模分析结果表明,FL评分和NI-BUT是干眼预测准确率较高的两个变量,均超过74%.结论:Random Forest算法可以用来构建泛化能力强、稳定性好的干眼预测模型,NI-BUT和FL与干眼有较强相关性,可以考虑将此二项作为临床检验是否患有干眼的数据标准.
干眼;机器学习;预测;特征筛选;模型
21
广东省医学科研基金项目;华厦转化医学青年基金项目
2021-09-16(万方平台首次上网日期,不代表论文的发表时间)
共5页
1644-1648