面向国产异构众核处理器SW26010的BFS优化方法
近年来,人们越来越关注计算机对数据密集型课题的处理能力.宽度优先搜索(Breadth First Search,BFS)是一种典型的数据密集型课题,被广泛应用于多种图算法.Graph 500 Benchmark以BFS搜索为核心算法,已经成为评价计算机处理大数据能力的基准.神威太湖之光超级计算机从2016年6月至2017年11月连续4次荣登Top 500榜单榜首,其处理器SW26010是首款由我国自主研制的异构众核处理器.文中研究了如何利用SW26010的体系结构特点加速BFS算法的问题,在SW26010上实现了基于单个核组的方向优化的融合BFS算法,使用字节图(bytemap)释放内层循环依赖性,利用异步DMA隐藏计算与便签存储器的访问开销,利用异构架构协同运算并对图做预处理.最终,以Graph 500作为基准测试程序处理scale为22的图,SW26010处理器单核组BFS的性能达到457.54MTEPS.
SW26010、神威太湖之光、Graph500、数据密集、异构众核、宽度优先搜索
47
TP311(计算技术、计算机技术)
国家重点研发计划资助项目;国家"973"计划资助项目;国家"863"计划资助项目
2020-08-26(万方平台首次上网日期,不代表论文的发表时间)
共7页
98-104