期刊专题

10.3772/j.issn.1002-0470.2020.02.002

一种运算和数据协同优化的深度学习编译框架

引用
近年来,深度学习算法和深度学习处理器已被广泛应用于工业界,如何从软件层面充分挖掘深度学习处理器的性能成为目前编译器领域研究的热点和难点.现有的深度学习编译框架更侧重于对程序的运算部分进行优化,对数据的优化非常有限,这并不能发挥深度学习处理器的峰值性能.本文分析了深度学习算法和硬件平台的特点,提出一种运算和数据协同优化的深度学习编译框架CDUCA,它包含计算图引擎、代码生成器、数据优化器3个不同层次的组件,在多个层次对运算和数据进行协同优化,最终生成高效的可部署模型.本文在现场可编程门阵列(FPGA)平台上评估了CDUCA,实验结果表明,对于典型的深度学习应用,CDUCA生成的模型性能能达到手工优化模型性能的86.5%.

深度学习、深度学习处理器、编译器、编译优化

30

国家重点研发计划2017YFA0700900,2017YFA0700902,2017YFA0700901,2017YFB1003101;国家自然科学基金61472396,61432016,61473275,61522211,61532016,61521092,61502446,61672491,61602441,61602446,61732002,61702478,61732020;北京市自然科学基金JQ18013;973计划2015CB358800;"核心电子器件、高端通用芯片及基础软件产品"科技重大专项2018ZX01031102;中国科学院科技成果转移转化重点专项KFJ-HGZX-013;中国科学院战略性先导科技专项B类XDB32050200;军队医学AWS17J011

2020-04-15(万方平台首次上网日期,不代表论文的发表时间)

共6页

120-125

相关文献
评论
暂无封面信息
查看本期封面目录

高技术通讯

1002-0470

11-2770/N

30

2020,30(2)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn