10.3772/j.issn.1002-0470.2014.09.003
基于滑动窗口的数据流字符串近似查询
针对数据访问模式随着网络技术的发展逐渐从静态磁盘转移到动态数据流的状况,研究了数据流上的字符串近似查询.为了解决数据流的连续性、无边界性、不可预知性和在线计算资源的局限性导致基于静态数据集的近似查询处理方法无法高效地支持数据流的问题,提出了基于滑动窗口数据流的字符串近似查询(AS3)方法.该方法基于过滤-验证框架和基本窗口索引更新机制,改进并应用非对称特征策略提取数据流和查询关键字的特征,采用了两个新的过滤算法——预剪裁过滤(PPF)算法和流统计(CFS)过滤算法,以及基于矩阵坐标的验证(CV)算法.实验结果表明,AS3方法能够高效地支持基于滑动窗口的数据流字符串近似查询,在保证结果准确率的同时具有较高的实时性及峰值处理能力.
数据流、字符串近似查询、滑动窗口、编辑距离
24
TP3;TN9
863计划2013AA13204,2012AA01A401;国家自然科学基金60903047;国家核高基2013ZX01039-002-001-001;中国科学院先导专项DA06030200
2014-12-19(万方平台首次上网日期,不代表论文的发表时间)
共8页
895-902