面向机器学习型区域滑坡易发性评价的训练样本采样方法
训练样本在基于机器学习的区域滑坡易发性评价中具有重要作用,训练样本通常是由滑坡(正样本)和非滑坡(负样本)组成,由采样方法采集得到.然而,现有正样本采样方法均没有度量所采集正样本的可信度,使得所采集训练样本可靠性得不到保证,制约了机器学习的区域滑坡易发性评价效果.针对这一问题,本文提出滑坡正样本原型采样方法(PBS),该方法利用某点与滑坡正样本原型的地理环境相似度和不相似度分别度量正样本与负样本的可信度,基于互斥法设置可信度阈值采集训练样本.以甘肃省油房沟流域为研究区,将PBS与已有代表性采样方法分别对油房沟流域构建基于逻辑回归、支持向量机和随机森林的滑坡易发性推测模型,对比有可信度和无可信度样本下的滑坡易发性评价效果.结果发现,正样本和负样本可信度与滑坡易发性评价效果分别呈现"波动上升"与"正相关"的特点,PBS方法在基于3种机器学习模型的滑坡易发性评价的验证精度(Accuracy)和接收者操作特征曲线下面积(AUC)值比已有代表性采样方法分别至少提高了 14.7%和14%,且标准差均较小,表明本文所提出方法是有效的.
区域滑坡易发性评价、训练样本采样、机器学习模型、可信度度量
79
TP3;F127;F207
2024-09-10(万方平台首次上网日期,不代表论文的发表时间)
共19页
1718-1736