10.3969/j.issn.1002-137X.2007.02.054
DnaReSM:一个基于多支持度的DNA重复序列挖掘算法
DNA序列分析研究是生物信息学的重要内容之一.基因组的基因相关区域和基因外区域中含有大量重复序列,尽管目前大多数重复序列的功能还没能肯定,但它们在遗传分析中已起重要作用.挖掘DNA重复序列成为DNA序列分析的关键.自底向上的挖掘算法中间过程产生很多短的、甚至单字符的模式,使得挖掘效率降低;另一方面,目前序列模式挖掘算法在多序列挖掘中表现出高效性,但由于单支持度定义的局限导致无法在挖掘过程中同时找到单条DNA序列中的重复序列,因此不能很好地适用于DNA重复序列挖掘.本文基于新的多支持度序列模式挖掘框架,提出了一种融合自底向上和自项向下策略挖掘DNA重复序列的新算法DnaReSM,其结果为生物学相关实验提供基础.实验结果表明,DnaReSM探测算法能有效挖掘DNA重复序列..挖掘DNA重复序列成为DNA序列分析的关键.自底向上的挖掘算法中间过程产生很多短的、甚至单字符的模式,使得挖掘效率降低;另一方面,目前序列模式挖掘算法在多序列挖掘中表现出高效性,但由于单支持度定义的局限导致无法在挖掘过程中同时找到单务DNA序列中的重复序列,因此不能很好地适用于DNA重复序列挖掘.本文基于新的多支持度序列模式挖掘框架,提出了种融合自底向上和自项向下策略挖掘DNA重复序列的新算法DnaReSM,其结果为生物学相关实验提供基础.实验结果表明,DnaReSM探测算法能有效挖掘DNA重复序列..挖掘DNA重复序列成为DNA序列分析的关键.自底向上的挖掘算
数据挖掘、DNA序列、重复序列、序列模式
34
TP3(计算技术、计算机技术)
国家自然科学基金60573093
2007-04-17(万方平台首次上网日期,不代表论文的发表时间)
共3页
211-212,封四