10.3969/j.issn.0001-5717.2022.11.025
成分数据理论和无监督聚类K-means方法提取背景和异常信息——以安徽省兆吉口铅锌矿床为例
地球化学数据是应用地球化学研究的重要组成部分,是化学勘查工作的基础成果.勘查地球化学数据基本上以元素的质量百分浓度(简称浓度)的形式表达,是典型的成分数据.其表达的是"组分/总体"相对质量贡献信息,而不是绝对的质量变化信息.浓度数据分布在单纯形空间,而不是整个欧式空间.对成分数据进行处理之前,进行适当的对数比值转换处理可以提高其信息表达.本文以安徽省兆吉口铅锌矿床土壤中Pb数据为示范案例,通过对数比值转换方法优化浓度数据的结构以提高相对信息的表达,并利用无监督学习K-means聚类方法根据对数比值转换数据分布空间质心的距离识别背景和异常信息,最后对K-means聚类方法识别的背景和异常与迭代2倍标准差法和浓度-面积分形分析法进行比较以衡量其表现.结果表明:浓度数据表达的是相对质量信息,而不是绝对质量关系,不同样品间不能通过比较浓度高低推断出质量的多寡关系.对数比值方法可以有效地提高浓度数据的结构和信息表达,K-means方法能够准确识别对数比值转换数据的背景和异常信息,其效果类似浓度-面积分形分析方法,比迭代2倍标准差法好.
机器学习、无监督分类、成分数据、K-means聚类、背景异常
96
TP301.6;P632;TP181
国家自然科学基金;国际地区合作与交流项目;东华理工大学博士科研启动基金项目
2022-12-29(万方平台首次上网日期,不代表论文的发表时间)
共18页
4038-4055