FPGA应用于高性能计算的研究现状和未来挑战
提升计算能效并满足新兴应用的性能需求是目前超级计算系统面临的两大挑战.FPGA(Field-Programma-ble Gate Array)低功耗和可重构的特性为应对上述挑战提供了可能.现有研究通过分析FPGA上计算核心的实际性能,探索了FPGA应用于高性能计算的可行性,但其性能分析未考虑卷积神经网络的计算核心且缺乏高性能处理器作为参照.文中针对当前高性能计算领域主要的计算核心(包括广度优先搜索、稀疏矩阵向量乘、Stencil、Smith-Wa-terman和卷积神经网络),总结了FPGA上各计算核心的实现和性能优化,并将其与SW26010众核处理器进行了对比;同时探讨了FPGA应用于高性能计算时存在的若干问题.分析表明,当前FPGA的能效最高为SW26010的63倍;FPGA上新兴应用(如图计算和深度学习)的性能最高为SW26010的26倍.未来,降低FPGA与主机的通信开销,提升其可编程性并完善基于FPGA的科学计算软件库,可有效推动FPGA在高性能计算方面的应用.
高性能计算、FPGA、加速、能效、新兴应用
46
TP302(计算技术、计算机技术)
国家自然科学基金91430214,61732018
2019-12-13(万方平台首次上网日期,不代表论文的发表时间)
共9页
11-19