期刊专题

10.7544/issn1000-1239.2016.20148246

阵列众核处理器上的高效归并排序算法

引用
排序是计算机科学中最基本的问题之一,随着众核处理器结构的不断发展,设计众核结构上的高效排序算法具有重要意义.众核处理器的一个重要方向是阵列众核处理器,根据阵列众核处理器的结构特点,提出了2种面向阵列众核结构的高效归并排序算法,通过利用DMA(direct memory access)多缓冲机制提高访存效率、深度平衡归并策略保持众多核心之间的负载均衡、SIMD (single instruction multiple data)归并方法提高归并计算效率以及片上交换归并策略提高片上数据重用率,大幅度提高了阵列众核处理器的排序性能.在异构融合阵列众核处理器DFMC(deeply-fused many-core)原型系统的实验结果表明,算法排序速度达647 MKeys/s(million keys per second),其排序效率(排序速度/峰值性能)是NVIDIA GPU上最快的归并排序算法(GTX580平台)的3.3倍,是Intel Xeon Phi上最快的归并排序算法的2.7倍.最后,建立了阵列众核处理器上归并排序算法的性能分析模型,利用该模型分析了主要结构参数与算法性能的关系,对阵列众核处理器的研究有一定的指导意义.

阵列众核、归并排序、排序网络、单指令多数据流、单程序多数据流、片上通信

53

TP302(计算技术、计算机技术)

国家“八六三”高技术研究发展计划基金项目2014AA01A301;“核高基”国家科技重大专项基金项目2013zx0102-8001-001-001This work was supported by the National High Technology Research and Development Program of China 863 Program2014AA01A301;the National Science and Technology Major Projects of Hegaoji2013zx0102-8001-001-001

2016-06-01(万方平台首次上网日期,不代表论文的发表时间)

共12页

362-373

暂无封面信息
查看本期封面目录

计算机研究与发展

1000-1239

11-1777/TP

53

2016,53(2)

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn