期刊专题

10.11959/j.issn.2096-0271.2021061

基于特征选择的局部敏感哈希位选择算法

引用
作为主流的信息检索方法,局部敏感哈希往往需要生成较长的哈希码才能达到检索要求.然而,长哈希码需要消耗巨大的存储空间且携带大量的冗余哈希位.为了解决此问题,采用特征工程中10种简单高效的选择算法从长局部敏感哈希码中选择信息量丰富的哈希位,去除冗余、无效的哈希位.这10种选择算法使用不同的方式来刻画每一个哈希位的性能或两个哈希位之间的相关性,如方差、汉明距离等.通过去除长哈希码中性能较差或具有高相关性的哈希位进行哈希位的选择.将选择后的哈希码与原哈希码的性能进行比较.在4个常用数据集上的实验结果表明,去除冗余哈希位后的哈希码与原哈希码的性能几乎相同,且其哈希位的去除比率能达到30%~70%.

近似近邻搜索;哈希学习;哈希位选择;特征选择;降维

7

TP391(计算技术、计算机技术)

国家自然科学基金资助项目No.61976195

2022-01-05(万方平台首次上网日期,不代表论文的发表时间)

共11页

67-77

暂无封面信息
查看本期封面目录

大数据

2096-0271

10-1321/G2

7

2021,7(6)

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn