基于HDFS的海量视频数据重分布算法
基于视频数据的分布式计算与基于文本类型数据的分布式计算存在很大的差异.视频数据本身是非结构化的,并且对于同样大小的视频,若其内容不同会导致任务执行消耗的时间也不同.对于简单的结构化数据,HDFS默认的负载均衡器能够解决负载均衡的问题.但是视频文件存在热点访问以及复杂度不一致的问题.使用HDFS默认的数据分布机制不能很好地解决计算负载均衡问题.因此提出了一种基于HDFS的海量视频数据重分布算法.首先对视频文件的访问次数以及历史视频分析对视频文件的访问时间进行记录;然后对数据进行量化之后将其加权作为该视频文件的负载度;最后使用文件置换手段将负载高的视频与低的视频进行置换,直到每个节点的负载达到均衡为止.实验结果表明,使用提出的数据重分布算法可以减少海量视频数据的处理时间.
HDFS、数据重分布、视频复杂度、视频热度
43
TP399(计算技术、计算机技术)
2016-08-30(万方平台首次上网日期,不代表论文的发表时间)
共5页
480-484