基于随机森林方法的常见人体中农兽药及化学污染物暴露与高尿酸血症的关联性研究
目的 探索高尿酸血症(HUA)的影响因素,尤其是农兽药及化学污染物暴露与高尿酸血症的关联,分析机器学习方法对于农兽药及化学污染物暴露数据的分析效果.方法 根据2018-2019年在石家庄和杭州进行的"降低成年超重者营养相关慢性病风险的适宜身体活动量研究",分别采用传统Logistic回归和随机森林(RF)建立基本人口学变量和农兽药及化学污染物暴露对HUA发病的预测模型.模型区分效果由ROC曲线下面积(AUC)进行评估.结果 RF结果显示,对HUA影响重要程度排名前5的因素依次为多西环素、4-氯苯氧乙酸酯、呋喃他酮、咪鲜胺和全氟癸酸浓度.RF模型的区分效果显著高于传统Logistic回归模型(AUC分别为0.934和0.735).结论 多西环素、4-氯苯氧乙酸酯、呋喃他酮、咪鲜胺和全氟癸酸、饮酒史、居住地为杭州、甘油三酯≥2.26mmol/L等可能是HUA的危险因素.RF模型适用于农兽药及化学污染物暴露数据的分析,且较常规Logistic回归模型对于鉴别HUA患者具有显著提升的区分能力.
高尿酸血症、农兽药、化学污染物、Logistic回归、随机森林模型
35
R155(营养卫生、食品卫生)
国家重点研发计划;国家自然科学基金;国家自然科学基金;上海市卫生健康委科研项目
2023-09-13(万方平台首次上网日期,不代表论文的发表时间)
共7页
645-651