10.13344/j.microbiol.china.200098
肥胖人群肠道菌群特征分析及机器学习模型
[背景]肠道菌群与人体健康之间的关系吸引了越来越多的关注,成为目前热门的研究热点.[目的]基于美国肠道计划公开数据库,对肥胖和健康人群肠道菌群进行比较分析,解析肥胖人群肠道菌群特征,并基于肠道菌群建立机器学习模型预测人群肥胖的状态,为基于肠道菌群干预肥胖提供理论基础.[方法]从公开数据库中获取美国肠道计划中的肠道菌数据,经过筛选得到1 655个健康(18.5<BMI<25)和898个肥胖(BMI>30)成年人的肠道菌群数据.针对α多样性,进行了Wilcox秩和检验分析并通过Logsitic回归判定α多样性与肥胖之间的关系;对Unweighted UniFrac、Weighted UniFrac和Bray-Curtis三种β多样性距离进行主成分分析(principal component analysis,PCA),探索肥胖与健康人群在肠道菌群组成上的差异;对于物种差异,进行Wilcox秩和检验探索差异菌属;通过PICRUSt分析预测可能的代谢通路,同时与肠道菌群进行相关性分析.利用Scikit-Learn软件包基于属水平的肠道菌群数据建立肥胖分类机器学习模型,并进行网络搜索确定最佳模型参数.[结果]经过Wilcox秩和检验,发现肥胖人群的α多样性都较健康人群显著下降,Logistic回归表明α多样性与人体肥胖状态有相关性.经过基于Weighted UniFrac、Unweighted UniFrac和Bray-Curtis三种距离的PCA,肥胖和健康人群的肠道菌群结构上无明显差异;在门水平上,肥胖人群中的Firmicutes和Bacteroidetes比值较低,在属水平上共发现57个在两组之间具有显著性差异的属,其中肥胖人群中的Ruminococcus相对丰度较高,而Prevotella、Akkermansia和Methanobacteriales的相对丰度较低;PICRUSt预测的代谢通路有63个代谢通路在两组之间具有显著差异;梯度提升回归树对于基于肠道菌群预测肥胖人群效果最好,受试曲线下与坐标轴围成的面积(area under curve,AUC)值可以达到0.769,测试集精度可以达到0.725.[结论]基于大规模的肠道菌群数据揭示了肥胖人群肠道菌群的特征,将机器学习运用到肥胖预测上面,为精准膳食、精准医疗提供新的研究思路和理论基础.
肠道菌群、肥胖、代谢通路、机器学习
47
国家重点研发计划2019YFF0217601
2021-02-02(万方平台首次上网日期,不代表论文的发表时间)
共10页
4328-4337