10.3969/j.issn.1002-3674.2006.05.003
聚类技术在大样本序列进化树分析中的应用
目的 进化树分析是生物信息学研究的重要工具,但是目前结果比较精确的进化树方法计算量都很大,无法在大样本数据中直接应用.本文试图通过结合聚类分析和进化树分析的方法以解决此问题.方法 以甲型流感病毒的H3A1序列为例,首先使用两步聚类将数据进行拆分,随后按照类别分类构建进化树,并最终将其拼接为完整的进化树结果.结果 序列的聚类结果与进化树结构间呈现出高度的一致性,各类别在时间上的更替规律在进化树中则呈现为各进化树节段的交替.结论 聚类方法与进化树方法相结合可以很好地满足大样本序列的进化树分析需求,如果在模型中加入其他参数,还可以使结果更为丰富,值得在该领域中推广.
生物信息学、聚类分析、进化树分析、甲型流感病毒
23
R1(预防医学、卫生学)
国家自然科学基金30400370
2006-11-28(万方平台首次上网日期,不代表论文的发表时间)
共4页
393-396