10.3969/j.issn.1002-3674.2021.04.004
基于ESPCA模型的结肠癌差异基因筛选研究
目的 验证ESPCA模型降维及变量选择的效果优于SPCA;利用ESPCA模型分析结肠癌基因数据,寻找不同主成分的通路信息,筛选结肠癌的差异基因.方法 模拟实验比较ESPCA模型与SPCA的降维及变量选择能力,通过灵敏度、特异度、准确度评价其变量筛选效果;收集TCGA结肠癌基因数据,利用ESPCA模型对结肠癌基因数据进行降维及变量筛选.结果 模拟实验获得的ESPCA模型具有较高的灵敏度、特异度和准确度,降维及变量选择效果优于SPCA.结肠癌数据分析结果显示:降维后ESPCA模型第一主成分中基因与18条GO-BP通路及7条KEGG通路有关,ESPCA模型第二主成分中基因与19条GO-BP通路有关;根据度中心性及中介中心性对主成分基因排序筛选出6个差异基因:MYC、CD44、PKM、FBL、PSMA7、RPS2,经GSE137327数据集验证具有较高的AUC值.结论 ESPCA模型在降维过程中既考虑数据本身信息,又考虑了生物网络信息,具有良好的降维及变量选择效果.结肠癌数据分析中ESPCA第一主成分中基因参与癌症相关的通路;ESPCA第二主成分中基因参与的通路与免疫相关;通路中基因参与癌症的发生发展过程、可能通过免疫反应相关通路调节结肠癌的发生发展过程;获得的6个结肠癌差异基因可为研究疾病发生机制和鉴别诊断提供依据.
边组稀疏主成分分析;高维组学;降维方法;变量选择
38
R195.1(保健组织与事业(卫生事业管理))
国家重大专项课题;国家自然科学基金青年基金
2021-10-15(万方平台首次上网日期,不代表论文的发表时间)
共5页
493-497