10.3969/j.issn.1002-3674.2021.01.006
XGBoost算法在二分类非平衡高维数据分析中的应用
目的 探讨XGBoost算法在二分类高维非平衡数据中的分类判别效果.方法 通过模拟实验及真实代谢组学数据分析,对XGBoost、随机森林、支持向量机、随机欠采样以及随机梯度提升树共五种方法进行比较.结果 模拟实验显示,XGBoost算法在数据非平衡较明显时,在各种实验条件下均优于或不劣于其他四种算法,在数据类别趋于平衡的情况下也同样具有较好的分类效果,且对噪声变量具有一定的抗干扰能力.实例分析显示,与其他四种算法相比,XGBoost算法的分类性能最优,且在保证分类效果的基础上具有更快的运算速度.结论 XGBoost算法适用于非平衡高维数据的判别分析,值得研究.
极端梯度提升算法、高维组学数据、分类判别
38
R195.1(保健组织与事业(卫生事业管理))
国家自然科学基金81973149,81773551
2021-03-25(万方平台首次上网日期,不代表论文的发表时间)
共4页
21-24