10.3969/j.issn.1002-3674.2020.06.019
决策树模型与logistic回归模型在生活饮用水水质影响因素分析中的应用
目的 使用决策树中的分类方法CHAID模型和logistic回归模型分析影响生活饮用水水质的相关因素,并比较两种模型分析结果的异同.方法 采用分层随机抽样的方法对渭南市2015-2017年452座集中式供水水厂的相关因素进行分析,并用受试者工作曲线(ROC)评价两种预测模型的效果.结果 logistic回归分析结果显示,消毒方式、正式运营时间、总投资和供水覆盖人口是水质不合格的影响因素,工程不消毒、工程运营时间越长,水厂规模(总投资和供水覆盖人口)越小,水质不合格率越高.决策树CHAID模型分析结果显示,消毒方式、总投资、供水覆盖人口、正式运营时间、监测点类型是水质不合格的影响因素,工程不消毒是水质不合格的主要影响因素.决策树模型ROC曲线下面积稍大于logistic回归模型(0.725 vs0.701,Z = 3.623,P<0.001).结论 CHAID决策树模型在水质影响因素风险评估方面有一定的应用价值,与logistic回归模型结合应用可从不同方面对水质影响因素进行分析预测,为后期饮用水的监管工作提供一定的科学依据.
生活饮用水、影响因素、logistic回归分析、CHAID模型
37
R123.1(环境卫生、环境医学)
中央重大公共卫生专项;中央公共卫生水和环境卫生项目补助资金2015-2017年
2021-02-05(万方平台首次上网日期,不代表论文的发表时间)
共5页
874-877,882