10.3969/j.issn.0258-8021.2012.04.015
一种生物相关性优先的两步卵巢癌化疗疗效敏感基因选取方法
作为卵巢癌主要诊疗手段之一的化疗,费用昂贵,副作用大,且患者反应的个体差异很大.本文提出一种首先依据诊断结果(卵巢癌化疗疗效)相关性进行特征选择,然后利用蒙特卡洛方法对特征基因排序,最终建立预测化疗反应模型的方法,克服了过度依赖分类率的弊端.首先利用奇异值分解,基于散点图和Kolmogorov-Smimov test(K-S test)的定性和定量分析非生物因素对基因表达谱的影响,结合化疗反应样本的聚类图进行基因筛选;然后采用基于信息增益的随机森林方法精选基因,得到与化疗相关的敏感基因.实验结果表明,此方法与经典方法( SVMRFE、T-test)相比,所选取出的特征基因具有较好的分类能力且保持稳定;从生物学角度分析显示,此方法所得到的敏感基因与化疗疗效的联系更加紧密,50个基因中,有4个( NR2F2、CLDN3、PURA、ClORF38)直接与卵巢癌相关;17个(US01、TCF7L2、NR2F2等)与肿瘤或癌症直接相关,或与肿瘤密切相关的生物过程(例细胞生长与繁殖、新陈代谢、细胞循环、DNA修复等)相关.
卵巢癌化疗疗效、有监督奇异值分解(SSVD)、特征选取、随机森林、决策树
31
R318(医用一般科学)
国家自然科学基金60801055,60801054;浙江省自然科学基金Z2090299
2012-11-26(万方平台首次上网日期,不代表论文的发表时间)
共10页
572-581