基于随机森林算法预测分析绝经妇女骨质疏松症关键lncRNA及其调控作用
目的 通过随机森林算法预测绝经妇女骨质疏松症(PMOP)关键长链非编码RNA(lncRNA)的调控作用.方法 检索基因表达数据库获取PMOP患者芯片数据,检索时限为建库至2020年12月.借助随机森林算法筛选关键lncRNA,通过starBase V2.0数据库预测lncRNA靶标基因,构建lncRNA-靶标基因调控网络,使用STRING V11进行靶标基因蛋白质-蛋白质相互作用分析,使用R语言、KOBAS数据库进行GO与KEGG富集分析.结果 共获得127个lncRNA表达数据,建立随机森林模型,筛选其中10个关键lncRNA,starBase V2.0预测得到98个靶标基因.靶标基因主要富集于RNA聚合酶活性等13个GO过程,半乳糖代谢等12条KEGG信号通路.结论 本研究通过挖掘PMOP基因芯片数据,基于随机森林算法筛选得出关键lncRNA并预测其靶标基因参与的生物学过程与信号通路,得出lncRNA可能参与调控成骨细胞、破骨细胞增殖分化活动、遗传物质转录翻译、机体糖脂代谢等活动.
长链非编码RNA;绝经妇女骨质疏松症;随机森林;机器学习
18
R681(骨科学(运动系疾病、矫形外科学))
广东省中医药局中医药科研项目20191263
2022-01-06(万方平台首次上网日期,不代表论文的发表时间)
共6页
23-27,封4