10.3772/j.issn.1002-0470.2015.04.005
龙芯UNCACHE加速原理及其在系统图形性能优化中的应用
针对当前采用独立显卡的桌面计算机系统架构普遍存在的CPU(中心处理单元)访问GPU(图形处理单元)存储空间数据传输延迟较大的瓶颈,采用了龙芯GS464处理器核心实现的UA(uncache acceleration)机制对GPU驱动程序中的GPU存储空间访问接口进行优化,极大地提高了处理器向GPU等IO存储空间连续数据写入的速度.详细分析了龙芯处理器UA机制的原理及其相对于uncache方式IO写所能带来的性能提升.通过UA机制优化了龙芯3A+ 2H平台的GPU驱动性能,x11peff测试结果显示,采用UA优化GPU驱动后,Xserver的一些接口性能提升达5% ~230%.将龙芯处理器的UA机制封装到了标准MMAP系统调用,并通过该扩展后的系统调用优化了Xserver的Xvideo扩展接口,实验结果显示,播放常见较高分辨率视频时该接口性能能够有6 ~12倍的性能提升.
处理器核、UA、图形、图像
25
TP3;TN4
国家“核高基”科技重大专项课题2009ZX01028-002-003,2009ZX01029-001-003,2012ZX01029-001-002-002,2014ZX01020201;国家自然科学基金61221062,61232009,61222204,61432016
2015-12-15(万方平台首次上网日期,不代表论文的发表时间)
共8页
357-364