10.3321/j.issn:1002-8331.2004.17.063
知识发现在2型糖尿病数据处理中的应用研究
目的:首次将知识发现理论引入到2型糖尿病发病相关因素数据处理中,从大量实测数据中识别出有效的、潜在的、有用的、可理解的发病规律.方法:根据2型糖尿病数据的特点,选用数据挖掘C4.5算法对17072条有效的整群抽样横断面健康调查数据进行决策树分类.结果:通过训练模型给出糖尿病患病与否的决策分类树,该决策树可以直观地给出发病相关因素的不同层次的相对影响,经实验测试结果对于未患病的正确识别率为92.05%,对于患病的正确识别率为80.90%,同时得出了血糖值为5.85的分类临界值.结论:决策分类树结果同目前认识的高危因素趋于一致,说明数据挖掘C4.5算法适用于2型糖尿病的发病相关因素数据分析处理,是2型糖尿病数据处理的一种新方法,其在疾病的宏观控制中有着广阔的应用前景.
2型糖尿病、知识发现、C4.5算法、数据挖掘
40
TP39(计算技术、计算机技术)
国家科技攻关项目2001BA702B01
2004-07-09(万方平台首次上网日期,不代表论文的发表时间)
共4页
198-201