10.11896/j.issn.1002-137X.2017.03.005
异构集群上的宏基因组聚类优化
宏基因组基因聚类是筛选致病基因的新型方法,其依赖于海量的测序数据、有效的聚类算法以及高效的计算机来实现.相关系数矩阵的计算是进行聚类前必须完成的操作,占总计算量的比重较大.以某基因库为例,包含1300个样本、每样本百万基因的数据,单线程运行需要27年.充分发挥多核CPU的潜力,利用GPU加速卡强大的计算能力,将程序扩展到多节点集群上运行,是重要而迫切的工作.在仔细分析算法的基础上,首先针对单CPU节点和单GPU卡做了高效实现,获得了接近理想的加速比;然后利用缓存优化进一步提升性能;最后使用负载均衡方法在MPI线程间分发计算任务,实现了良好的扩展.相比未优化的单线程程序,16节点CPU获得了238.8倍的加速,6块GPU卡获得了263.8倍的加速.
基因聚类、异构计算、缓存优化、负载均衡
44
TP391(计算技术、计算机技术)
国家高技术研究发展计划863:高性能计算环境应用服务优化关键技术研究2014AA01A302;日本学术振兴会
2017-04-14(万方平台首次上网日期,不代表论文的发表时间)
共4页
20-22,47