10.3969/j.issn.1006-2475.2016.04.014
一种支持通配符查询的XML模式匹配算法
XML查询语言当中,包含通配符倡的查询能够方便有效地满足一些特殊查询要求,但在大数据时代下XML文件容量与结构复杂性不断增加,现有支持通配符查询的算法需消耗巨量内存来解析XML,并且在对嵌套通配符处理时需要大量的单路径匹配操作和局部结果的缓存。针对此现状,结合现有经典算法,提出一种新的、能够高效解决小枝模式当中含有通配符倡的查询算法—WTwigList。该算法首先对查询模式进行通配符的层次关系处理,减少不必要的通配符匹配,以数据流形式解析XML文件并执行局部的扩展Dewey编码,经过滤操作后得到有序的叶子节点编码列表,在列表中执行匹配操作得到结果;其次在真实和合成数据集上做大量实验,结果表明WTwigList算法与现有算法相比,能够有效提高查询效率,在空间效率上具有一定优势,且能够快速准确地处理查询模式中P-C关系。
通配符查询、流数据处理、扩展Dewey编码、XML模式匹配
TP311(计算技术、计算机技术)
江苏省自然科学基金资助项目BK20140826
2016-05-25(万方平台首次上网日期,不代表论文的发表时间)
共9页
65-73