10.3969/j.issn.1006-2475.2019.08.016
利用网格计算加速基因大数据分析的方法实现
为解决基因测序数据量大、数据分析时间长,搭建FPGA、GPU计算平台成本高昂且计算软件兼容不足的问题,运用分布式计算思想设计高通量测序数据分析架构Sequence Grid(SeqGrid).该架构安装centos开源操作系统,利用网格引擎Sun Grid Engine(SGE)、普通CPU、机械硬盘和SSD硬盘,通过并发调度生物信息软件bwa、GATK等实现数据分析.结果表明:单人全外显子组30 GB数据分析时间从15 h缩短至1 h,计算速度达到串行流程的15倍,有效提高了数据分析效率.
网格计算、高性能计算集群、生物信息、高通量测序
TP338.8(计算技术、计算机技术)
国家重点研发计划资助项目2018YFB1004100
2019-08-22(万方平台首次上网日期,不代表论文的发表时间)
共7页
85-91