一种基于改进网格多维TTI索引的动态Top-k查询算法
Top k查询是目前海量数据在动态环境中高效处理的重要方法之一.在许多实际应用中,满足用户偏好的top-k查询一般由两个部分组成:选择条件和排序函数.用户可自行设置排序函数,也可选择对不同数据子集进行查询.在传统数据库领域中已经对top-k算法进行了深入的研究,但是现有的方法不适用于大量目标对象的属性值发生动态变化的情况.在查询过程中由于目标对象的属性值发生改变可能导致查询结果的改变,从而对算法性能有更高的要求.围绕动态top-k计算问题,在网格索引的基础上提出了TTI索引,通过TTI索引中的概要信息高效计算网格k支配能力并划分影响区和自由区.根据划分的区域裁剪数据集并降低数据动态变化时需重新计算发生的概率.实验中采用多种数据集进行测试,分别与top-k、RankCube和CIA算法进行了比较.实验结果验证了算法的有效性,实验数据表明在静态情况下,该文算法的查询效率可比传统top-k算法最多快至8倍,动态情况下可比传统top-k算法最多快10倍.
Top-k查询、网格索引、分区、概要、动态
42
TP311(计算技术、计算机技术)
国家自然科学基金61728204,61672284,61373015,61300052,41301407;中国民用航空局安全能力建设基金AS-SA2015/21;南京航空航天大学科研基地创新基金NJ20160028;青年科技创新基金NT2018028;智能电网保护和运行控制国家重点实验室基金;江苏高校优势学科建设工程资助项目BK20130819;澳大利亚研究理事会发现项目ARC DP140100104
2019-09-23(万方平台首次上网日期,不代表论文的发表时间)
共18页
1827-1844