云雾覆盖下地表温度重建机器学习模型的训练集敏感性分析
热红外遥感是监测地表温度的重要技术手段.然而,由于其易受云雾影响,热红外遥感反演地表温度存在大量的观测空白区域,严重影响地表温度产品的应用.近年来,机器学习算法的发展为实现地表温度无缝观测提供了新的技术手段.然而,基于机器学习的云雾覆盖像元重建方法与训练样本的数量和分布有着直接的联系,其应用条件在现有研究中还鲜有讨论.为深入探究重建过程中训练数据量和数值分布对重建精度的影响,本文选择基于随机森林的地表温度重建模型开展样本敏感性分析,采用美国MODIS陆地产品和欧洲第二代静止气象卫星(MSG)入射短波辐射产品重建不同训练样本集下的地表温度,并与真实地表温度数据比较,定量评估重建结果精度与样本数量和分布之间关系.研究结果表明:(1)地表温度重建精度随着训练样本数据量增加显著转好.(2)在数据量一定的情况下,随机采样方式因为具有空间代表性比区域取样方式具有更精确更稳定的精度,能将重建后的均方根误差降到2.1 K以下,相关系数达到0.93以上.即使数据量较小,随机取样方式的重建精度较稳定的特点使得模型对因数据量不足造成的重建精度降低的负面效应具有减弱作用.(3)进一步划分不同高程带和植被覆盖条件下的训练集,当训练集所处范围与重建集所处范围一致或者训练集覆盖范围越广时,重建精度越好.总体而言,上述研究成果为今后采用机器学习方法重建地表温度应用中训练样本选择以及获取高精度地表温度重建结果提供了重要的科学参考.
地表温度;随机森林;重建;训练数据;高程;植被
25
国家自然科学基金;中国科学院"西部之光"西部青年学者A类;四川省科技计划资助
2021-09-28(万方平台首次上网日期,不代表论文的发表时间)
共13页
1722-1734