基于ARM的图像几何变换算法库实现和优化技术研究
高性能原语基础算法库(Intel?Integrated Performance Primitives,Intel IPP)是面向信号、图像处理领域的高性能多媒体加速库.然而,截至目前,暂时没有基于ARM架构的高性能IPP库.文中针对镜像变换、重映射、仿射、透视变换等基础图像几何变换算法,实现了一个基于ARM计算平台的高性能算法库PerfIPP,并通过SIMD汇编优化、内存对齐、数据预计算、高性能矩阵转置等优化技术,显著提升了上述算法的性能.同时,通过对比不同指令组合、不同指令排列、不同取数存储方式等所带来的性能差异,总结图像几何变换算法在A RM计算平台上实现与优化的关键技术.实验结果表明,在华为鲲鹏920平台上,相比开源计算机视觉库OpenCV,PerfIPP在满足精度要求的同时,在上述基础图像几何变换上获得了108.08% ~435.5%的性能提升,并达到了在英特尔至强E5-2640处理器上Intel IPP库平均性能的83.79%.
IPP、ARM、NEON Intrinsic、几何变换、插值
49
TP391(计算技术、计算机技术)
国家重点研发计划;国家自然科学基金;北京市自然科学基金
2022-10-20(万方平台首次上网日期,不代表论文的发表时间)
共8页
10-17