10.3969/j.issn.1671-6906.2010.05.008
FFT算法的并行化性能分析
以串行FFTW为基准,从程序运行时间、通信开销两方面分析了基于消息传递型(MPI-FFT)和共享内存型(CUFFT)并行FFT实现的性能. 实验表明,并行FFT都可以提升计算速度至FFTW的30~80倍,对于中等规模的数据,CUFFT的计算速度略优于MPI-FFT,且其通信开销明显较低,具有较高性价比和较好的应用前景.
并行性能、CUFFT、MPI、FFTW
21
TP391(计算技术、计算机技术)
河南省教育厅自然科学研究项目2009A520034
2011-01-28(万方平台首次上网日期,不代表论文的发表时间)
共4页
30-32,41