10.3969/j.issn.1681-5289.2023.07.007
基于魂芯五号A的深度学习网络模型量化训练与部署方法
随着深度学习在产业界加速落地,卷积神经网络在许多工业场景的应用中取得了令人惊叹的成就.为了支撑工业生产领域的智能化改造需求,业界纷纷推出专门针对卷积计算优化的边缘计算芯片.本文将介绍基于魂芯五号A智能计算芯片部署针对工业色选领域的神经网络模型案例.基于深度神经网络领域的倒残差结构以及智能芯片的计算特点,本文提出适合芯片部署的深度学习网络模型,结合量化感知训练方法和计算图优化方法,有效提高网络推理速度、降低精度损失.实际测试表明,在基于8-bit非对称量化感知训练以及优化部署后,待部署模型大小仅为原模型的30%,量化后模型准确率损失约为0.25%,单个核心推理速度约为3000物料每秒.
边缘计算、量化感知、计算图优化、深度学习
32
TP393;TN929.5;R687.4
2023-07-27(万方平台首次上网日期,不代表论文的发表时间)
共7页
34-40