比特串划分多索引的近邻搜索算法
哈希表示的比特串是解决海量数据相似性搜索问题最有效的方法之一.针对比特串索引方式导致搜索效果低下的问题,提出一种基于比特串划分多索引的近邻搜索算法.首先由于比特串划分本质是一个组合优化问题,采用贪婪的思想给出该问题的近似解;其次在近邻查询阶段,结合多索引结构提出新的查询扩展和融合机制;最后通过采用一种查询自适应的办法优化多索引之间的不平衡性.在MNIST,CIFAR-10,SIFT-1M和GIST-1M数据集上使用Matlab软件进行实验的结果表明,该算法在基于哈希表示的索引结构以及在近邻搜索方面具有有效性和通用性.
哈希表示、比特串划分、多表索引、查询扩展、近邻搜索
31
TP391.41(计算技术、计算机技术)
国家自然科学基金61300187,61672379
2019-06-04(万方平台首次上网日期,不代表论文的发表时间)
共9页
771-779