10.3969/j.issn.1002-5057.2023.03.009
模型轻量化与加速研究进展
5G通信技术使物联网得到了更多的应用场景,也为人工智能技术的落地提供了更多的可能性.目前,基于深度学习模型的人工智能技术的部署在工业界中得到了广泛的研究.然而,深度学习模型强大的性能依赖于它庞大的参数量和计算量,使得其在实际应用和部署中面临挑战.模型轻量化与加速旨在最小影响模型性能的情况下,降低模型的参数量和计算量从而提高模型的推理速度.文章介绍了目前该领域的最新技术,包括网络剪枝、轻量化网络设计、模型量化和知识蒸馏,并对它们的优缺点加以分析,最后讨论了模型轻量化与加速存在的挑战和发展前景.
深度学习、网络剪枝、轻量化网络设计、模型量化、知识蒸馏
TP183(自动化基础理论)
2023-07-24(万方平台首次上网日期,不代表论文的发表时间)
共6页
35-40