10.3969/j.issn.1002-3674.2022.06.003
基于Stacking集成学习的肾综合征出血热发病数据预测模型研究
目的 探讨基于Stacking结构的集成模型在预测分析辽宁省肾综合征出血热发病趋势中的可行性.方法 利用公共卫生科学数据中心2005-2018年肾综合征出血热发病数据,以集成学习方法和非集成学习方法为基学习器,以线性回归为元学习器构建Stacking集成学习模型,比较单一预测模型和由不同类预测模型组合而成的Stacking集成学习模型的预测精度.通过五折交叉验证优化参数,对肾综合征出血热发病数据进行预测,并评价模型的预测能力,采用平均绝对误差和均方根误差评价模型的预测效果.结果 最小绝对收缩和选择算子回归、多层感知器、支持向量机、随机森林、极度梯度提升树和Stacking集成学习模型交叉验证结果的平均绝对误差均值分别为48.13,49.93,47.68,23.21,23.07,24.89,经拟合设置最优参数后各模型的平均绝对误差分别为25.54,44.58,25.57,21.25,19.47,22.49;各模型交叉验证结果的均方根误差平均值分别为55.23,56.91,54.74,28.87,29.20,31.23,经拟合设置最优参数后各模型的均方根误差分别为30.24,55.24,29.56,28.41,28.47,27.77.结论 基于随机森林、极度梯度提升树和Stacking集成学习模型构建的发病人数预测模型对辽宁省肾综合征出血热发病的预测准确率优于最小绝对收缩和选择算子回归、多层感知器和支持向量机等单一模型.本研究为疾病防控工作中预测模型的选择提供一定的方法学参考.
Stacking、模型、肾综合征出血热、预测
39
R195.1(保健组织与事业(卫生事业管理))
国家自然科学基金;辽宁省自然科学基金
2023-02-22(万方平台首次上网日期,不代表论文的发表时间)
共4页
811-814