10.3321/j.issn:1002-0470.2006.05.012
cDNA芯片缺失值处理对基于基因表达谱的疾病分类的影响
选取了4套cDNA芯片数据,分别运用补零和K近邻的方法,对有检测缺失的基因进行了补缺失值处理,分析了不同处理对支持向量机、K近邻分类器、决策树三种分类器分类效能的影响.结果显示: 在cDNA基因表达谱数据中,对检测缺失率不高于5%的基因补缺失值是一种较好的策略,这样可以保留较多的基因供后续的功能分析,同时仍然能够保持很高的疾病分类效能.
基因表达谱、缺失值、分类
16
Q81(生物工程学(生物技术))
中国科学院资助项目30370798,30170515,30370388
2006-06-22(万方平台首次上网日期,不代表论文的发表时间)
共5页
501-505