10.11896/j.issn.1002-137X.2019.09.047
基于多组学数据识别癌症驱动通路的模型和算法
通过整合体细胞突变、拷贝数变异和基因表达等3种组学数据,提出识别癌症驱动通路的改进最大权重子矩阵模型.该模型用通路中基因平均权重调控覆盖度和互斥度,对权重大的基因集覆盖度进行加强,同时放松其高互斥度约束.引入基于贪心算法的重组算子,提出求解该模型的单亲遗传算法PGA-MWS.采用胶质母细胞瘤和卵巢癌数据集对算法PGA-MWS和GA进行实验对比分析.实验结果显示,较GA方法,基于改进模型的PGA-MWS算法能识别出覆盖度高但互斥度不太高的基因集,且其识别的基因集中,许多均参与已知信号通路,并被证实与癌细胞密切相关,同时还能识别几种潜在的候选驱动通路,因此PGA-MWS方法可作为检测癌症驱动通路的一种有效补充.
驱动通路、多组学数据、癌症、算法、模型
46
TP301(计算技术、计算机技术)
国家自然科学基金项目61762015,61502111,61662007,61763003;广西自然科学基金项目2015GXNSFAA139288,2016GXNSFAA380192;广西研究生教育创新计划项目XYCSZ2018078;"八桂学者"工程专项,广西多源信息挖掘与安全重点实验室系统性研究基金项目14-A-03-02,15-A-03-02;广西科技基地和人才专项AD16380008
2019-10-14(万方平台首次上网日期,不代表论文的发表时间)
共5页
310-314