10.3969/j.issn.1681-5289.2024.01.005
基于图卷积的神经网络硬件加速器设计
目前很多的应用都需要用图数据来表示和处理,图数据是位于非欧几里得空间中的不规则数据,出于图数据处理的需求,图卷积神经网络(GCN)应运而生.GCN的主要处理步骤有:聚合,转换和激活.在本文中,我们采用一种异构模式对GCN的推理过程进行加速.根据数据本身的特点,在转换阶段,加速器采用脉动阵列执行计算来改善数据流,在聚合阶段,将所要处理的负载分成两种类型,有助于改善聚合阶段计算过程中的负载不平衡现象,同时在一定程度上缩短计算时间.最后,通过在Xilinx Virtex UltraScale+VU37P HBM FPGA平台上进行性能评估,本工作相对于CPU和GPU分别实现了平均389.19 ×和6.73 ×的加速.
图卷积、机器学习、硬件加速
33
TP391.41;TP183;TN402
2024-02-27(万方平台首次上网日期,不代表论文的发表时间)
共7页
24-29,50