10.11896/j.issn.1002-137X.2018.06.009
一种面向密文基因数据的子序列外包查询方法
精准医疗是一种强烈依赖病人基因组分析结果的医疗模式,而子串检索是执行基因组分析的重要方法.近年来,基因数据的数据量急剧增长,其存储代价和处理复杂度已远超医疗方可承受的范围.于是,利用云服务提供商廉价的存储设备和强大的计算能力,将基因数据托管至云服务提供商成为切实可行的解决方案.考虑到云服务提供商并不完全可信,在数据上传至云端之前执行数据加密是保证数据安全性和隐私性的有效方法.然而,如何基于加密数据执行序列检索成为亟待解决的问题.针对这一问题,对基因数据处理和密文检索领域进行调研,提出采用q-gram技术对序列数据的定长窗口创建前缀签名的方案,并在执行查询时在每个窗口中完成前缀查询的解决方案.在子序列查询过程中,云端并不能获取用户数据明文.最后通过实验验证了所提方案具有较好的性能和存储开销,例如当窗口大小为100且q取6时,对100000长序列串执行构建索引耗时15.06 s.与GPSE相比,所提方法的性能更优.
精准医疗、子序列检索、密文查询、全文检索
45
TP309.2(计算技术、计算机技术)
国家自然科学基金61232002,61572378
2018-08-30(万方平台首次上网日期,不代表论文的发表时间)
共6页
51-56