10.3969/j.issn.1671-1815.2018.04.049
大型文本数据库中分布式数据去重备份方法
数据去重可删除备份过程中的冗余数据,节约存储资源与与网络带宽,是目前数据存储领域研究的重点问题.针对传统方法去重率和吞吐量低的问题,提出一种新的大型文本数据库中分布式数据去重备份方法.介绍了大型文本数据库中分布式数据去重方法基本思想,通过文件管理部分对数据片组中的扶贫数据进行查询和统计,给出数据片组路由策略,分析了数据预取过程.通过最终权值完成对数据块的排列,以恢复时间与恢复成本达到最小化为目的设计适应度函数.通过改进遗传方法对大型文本数据库中分布式扶贫数据进行备份.实验结果表明,所提方法有很高的去重率和吞吐量,且成本低,恢复速度快.
文本数据库、分布式数据、去重、备份
18
TP393.07(计算技术、计算机技术)
中央高校基本科研业务费专项资金XDJK2014C110;贵州省科学技术基金黔科合LH字[2014]7538号
2018-04-08(万方平台首次上网日期,不代表论文的发表时间)
共6页
310-315