10.16652/j.issn.1004-373x.2019.20.039
混合kNN算法在2型糖尿病预测诊断中的研究
2型糖尿病(T2DM)原始医疗数据具有广维度、多噪声、强耦合、非线性等特点.传统的kNN算法不能很好地利用全局信息,对异常值也不敏感,并且算法中的近邻值k以及权重的确定对于实验结果有很明显的影响,因此,提出一种混合kNN算法(IPCA-kNN)预测诊断2型糖尿病患者的新型预测模型.采用ISODATA算法对离散点进行剔除,数据集中的缺失值使用随机加权热卡(BB-Hotdeck)算法进行插补;构造kNN分类器时使用主成分分析(PCA)对每个属性赋不同权重,对于k值的确定使用交叉验证中的K-fold Cross Validation(K-CV)算法,通过准确度、敏感度和特异度验证所提模型有效.
2型糖尿病、预测诊断、混合kNN、数据处理、仿真实验、结果分析
42
TN912-34;TP202
山西省自然科学基金项目201701D11100202
2019-10-31(万方平台首次上网日期,不代表论文的发表时间)
共5页
164-168