一种基于重复数据删除的镜像文件存储方法研究
在云计算环境中,基础设施即服务的日益发展导致虚拟机和虚拟机镜像的急剧增加,例如,Amazon ElasticCompute Cloud(EC2)有6521个公共虚拟机镜像文件,这给云环境的管理带来了极大的挑战,特别是大量镜像文件带来的重复数据的空间存储问题.为解决这一问题,提出一种基于固定分块的镜像文件重复数据删除的存储方案.当存储一个镜像文件时,先计算该镜像文件的指纹,并与指纹库的指纹比较,若存在则用指针替代,否则采用固定分块对镜像文件分割存储.为此,可以设计镜像文件元数据格式和镜像文件MD5索引表来解决上述问题.实验结果表明,内容相同的镜像文件只是元数据的开销并实现秒传,而相同版本、相同系统、不同软件的镜像组的重删率约达到58%.因此,本方案是非常有效的.
云计算、重复数据删除、镜像文件存储
43
TP399(计算技术、计算机技术)
2016-12-16(万方平台首次上网日期,不代表论文的发表时间)
共4页
495-498