10.3969/j.issn.1002-3674.2012.02.001
随机森林回归分析及在代谢调控关系研究中的应用
目的 探讨随机森林回归处理非线性、具有交互作用数据的性能,并将其应用于高维代谢组学数据的代谢网络变量筛选.方法 通过模拟试验验证随机森林回归在具有交互作用和非线性情况下回归分析的效果,同时应用于卵巢良恶性肿瘤鉴别的代谢组学数据分析.结果 模拟实验结果显示:对于具有交互作用及其他非线性关系的模拟数据,随机森林回归模型的效果明显优于多元线性回归模型;卵巢癌代谢组学数据分析显示,使用随机森林回归分析能够获得更为理想的结果.结论 随机森林回归作为一种非参数回归技术,在一定的样本含量下(如n>100),能够在高维数据中有效地分析具有交互作用和非线性关系的数据.
随机森林、多元回归分析、代谢组学、代谢调控网络
29
TP3;TG1
国家自然科学基金资助81172767
2012-10-29(万方平台首次上网日期,不代表论文的发表时间)
共4页
158-160,163