期刊专题

10.11897/SP.J.1016.2016.02061

基于外存后缀树的 top-k 局部比对算法

引用
局部比对是一种衡量字符串间相似程度的技术,它在生物信息学领域具有十分重要的作用。介于此,许多学者已对其进行了深入的研究。然而,随着数据规模的扩大,常规的内存算法已不适用于支持大规模文本数据的局部比对。为解决上述问题,该文研究了基于外存后缀树的 top-k 局部比对算法。它从根本上消除了内存空间对算法的束缚。为了提高算法的性能,该文首先将经典内存算法中的过滤策略引入该文。通过适当的修改,这些策略可以基于外存后缀树有效地降低计算开销。其次,该文提出一种巧妙的算法支持 top-k 局部比对查询。该算法通过引入启发式策略有效规避了 TA 算法的固有问题。具体地,它一方面可以提高算法的过滤能力,另一方面可以降低候选对象的维护代价。再次,该文对外存后缀树和磁盘的工作原理进行了研究。基于此,该文提出一种槽的结构支持查询。该结构既可以实现磁盘的顺序访问,又可以降低磁盘的访问次数。因此,它可以有效提高算法的查询效率。最后,大量的实验验证了该文所提出算法的有效性。

局部比对、top-k、外存后缀树、叉子区域

39

TP301(计算技术、计算机技术)

国家“九七三”重点基础研究发展规划项目基金2012CB316201;国家自然科学基金61572122,61173031,61129002,61532021,U1401256;国家优秀青年科学基金61322208资助.

2016-11-07(万方平台首次上网日期,不代表论文的发表时间)

共14页

2061-2074

相关文献
评论
暂无封面信息
查看本期封面目录

计算机学报

0254-4164

11-1826/TP

39

2016,39(10)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn