10.3772/j.issn.1002-0470.2021.05.001
面向多任务处理的神经网络加速器设计
本文从多任务系统以及算法硬件协同设计的角度出发,提出了一种面向多任务处理的神经网络加速器架构.在算法方面,提出了一套多任务处理算法,能够有效挖掘多任务间的特征重复性和计算重用性;在架构设计方面,设计了能够利用网络参数共享实现多任务间计算重用的加速器架构.该架构采用基于时间片的调度方法,实现了多视觉任务的高效并行处理.实验结果表明,与目前主流的移动图形处理器(GPU)相比,本文提出的加速器能够在多任务推理阶段减少65.80%的乘法运算量,同时获得了11倍的性能提升.
神经网络、多任务、加速器、参数共享、计算复用
31
TP302;TP273.5;F273.2
国家重点研发计划;北京市自然科学基金;国家自然科学基金;国家自然科学基金;北京市科技计划;北京市科技计划;中国科学院战略性先导科技专项
2021-06-23(万方平台首次上网日期,不代表论文的发表时间)
共7页
457-463