10.3969/j.issn.1002-137X.2012.08.039
最优分数位minwise哈希算法的研究
在信息检索中,minwise哈希算法用于估值集合的相似度;b位minwise哈希算法则通过存储哈希值的b位来估算相似度,从而节省了存储空间和计算时间.分数位minwise哈希算法对各种精度和存储空间需求有着更加广泛的可选择性.对于给定的分数位f,构建f的方式有很多.分析了有限的分数位组合方式,给出最优化分数位的理论分析.大量的实验验证了此方法的有效性.
相似度估值、哈希、最优分数位
39
TP301.6(计算技术、计算机技术)
国家自然科学基金项目M0921005,60873081,60970095,61003033;湖南省杰出青年基金11JJ1012;教育部新世纪优秀人才支持计划NCET-10-0787
2012-12-05(万方平台首次上网日期,不代表论文的发表时间)
共4页
182-185