10.13730/j.issn.1009-2595.2022.12.005
基于加权基因共表达网络分析慢性阻塞性肺疾病的差异基因及信号通路
目的 利用生物信息学方法探讨慢性阻塞性肺疾病(chronic obstructive pulmonary diseases,COPD)发病机制中的重要基因与信号通路.方法 从高通量基因表达(gene expression omnibus,GEO)数据库下载COPD组和正常组基因表达数据,采用加权基因共表达网络分析法(weighted gene co-expression network analysis,WGCNA)建立COPD的基因共表达网络和识别共表达模块,以共表达模块中高系数模块和差异基因中共同靶点作为COPD的作用靶点,用Genecards和DisGeNET疾病库来进行验证,得到COPD的关键基因.对关键基因进行蛋白互作网络分析(protein-pro-tein interactions,PPI)、基因本体功能(gene ontology,GO)和京都基因与基因组百科全书(kyoto encyclopedia of genes and genomes,KEGG)分析,并通过Cytoscape建立关键靶点、生物过程和通路的互作网络.再通过CytoHubba插件提取前10的Hub基因进一步筛选出COPD的潜在生物标志物,输入到全面医学文献检索与基因云分析系统(gene-cloud of biotechnology information,GCBI)进行转录因子的分析.结果 从GEO 数据库得到COPD相关差异基因3138个,与WGCNA中的turquoise模块取交集,验证后得到37个COPD的关键基因,主要富集在磷酸磷脂酰肌醇-3羟基激酶和丝苏氨酸蛋白激酶(phosphatidylinositol 3-kinase and serthreonine protein kinase,PI3K/Akt)信号通路.CytoHubba 筛选得到的前10的核心基因为:乳腺癌易感基因1(breast cancer susceptibility gene 1,BRCA1)、张力蛋白1(tension protein 1,TNS1)、FMS 样酪氨酸激酶 3(FMS-like tyrosine kinase 3,FLT3)、整合素 β3(int egrin β3,ITGB3)、血管性血友病因子(von Willebrand factor,VWF)、转谷氨酰胺酶 2(transglutaminase 2,TGM2)、富含半胱氨酸的酸性分泌蛋白(secreted protein acidic and rich in cysteine,SPARC)、磷脂酰肌醇-4,5-二磷酸 3-激酶催化亚基 α(phosphatidylinositol-4,5-bi-sphosphate 3-kinase catalytic subunit alpha,PIK3CA)、半乳糖凝集素-3(lectin galactoside-binding soluble 3,LgALS3)、B-细胞淋巴瘤因子 2 样蛋白 1 基因(B-cell lymphoma factor 2-lilike protein 1,BCL2L1),其中 PIK3CA、BRCA1、ITGB3、VWF、FLT3、BCL2L1均富集在PI3K-Akt信号通路.转录因子分析结果中Sp1、Sp3可同时调控多个COPD关键基因的表达,而核心基因BRCA1、SPARC可被Sp1等多个转录因子调控.结论 BRCA1、TNS1、FLT3、LGALS3、ITGB3、VWF、BCL2L1、TGM2、SPARC、PIK3CA与COPD发展密切相关,这些核心基因通过调控PI3K-Akt等信号通路,参与到细胞迁移、细胞基质、粘附斑以及抗氧化能等生物过程中进而调节COPD的发展.
慢性阻塞性肺疾病、加权基因共表达网络分析、生物信息学、高通量基因表达
36
R563.9(呼吸系及胸部疾病)
国家自然科学基金81903815
2023-02-20(万方平台首次上网日期,不代表论文的发表时间)
共8页
959-966