10.3969/j.issn.1673-7571.2022.1.004
基因表达数据库中肺结核芯片数据的挖掘和分析
目的:运用生物信息学分析方法挖掘大数据中肺结核相关的关键基因,为进一步探索肺结核可能的潜在调控靶点提供理论依据.方法:从基因表达数据库(GEO)下载与肺结核相关的高通量基因表达谱芯片数据,应用R语言筛选肺结核患者与正常人差异基因;对差异表达基因进行基因本体(GO)功能富集分析和DisGeNET模块相关疾病谱分析,蛋白质相互作用网络的构建及可视化分析.结果:得到46个差异表达基因.GO功能富集分析发现这些基因主要涉及免疫反应、正性调控等生物学过程.疾病谱分析结果主要富集在肺部炎症、器官发育等.基于String数据库构建蛋白互作网络,进一步筛选出肺结核候选基因,包括SERPINA1、MAPK14、CKAP4、CXCR1、SELL、GNG11、GZMK、KLRC1、SDC2、NCF4和IL1RN.结论:SERPINA1、MAPK14、CKAP4、CXCR1、SELL、GNG11、GZMK、KLRC1、SDC2、NCF4和IL1RN可能是肺结核相关的关键候选基因,为该疾病进一步的功能研究提供了理论依据.通过大数据对疾病谱基因组数据平台挖掘,能够为疾病高危基因组识别及疾病预防提供重要的借鉴意义.
肺结核、GEO、生物信息学分析、差异表达基因
17
R319(医用一般科学)
国家自然科学基金;陕西省自然科学基金资助项目
2022-04-18(万方平台首次上网日期,不代表论文的发表时间)
共7页
20-26