机器学习结合分子指纹预测过硫酸盐氧化体系污染物的降解速率常数
降解速率是环境污染物处理工艺选用和设计中必须考虑的关键因素,与传统实验方法相比,基于定量构效关系(QSAR)模型预测有机物降解速率的方法可以明显降低人力、物力和时间成本.文章基于分子指纹(MF),分别使用随机森林和极端梯度提升(XGBoost)机器学习算法,成功构建了预测过硫酸盐高级氧化体系中有机污染物降解速率常数的MF-QSAR模型.与MD-QSAR模型相比,MF-QSAR模型在应对更大的数据集时,仍能表现出良好的性能,XGBoost模型的决定系数和均方根误差分别为0.8378和0.3160.最后,使用SHapley Additive exPlanations方法解释了MF具体位点对模型结果的贡献度,XGBoost模型正确区分了富电子和吸电子分子特征对模型的正负影响.
降解速率常数、定量构效关系、分子指纹、机器学习
37
X703.1(一般性问题)
国家农业科学研究专项基金项目201503108
2022-07-29(万方平台首次上网日期,不代表论文的发表时间)
共7页
42-48