10.3778/j.issn.1002-8331.2004-0309
向量分组聚集计算技术研究
分组聚集计算是OLAP重要的操作符之一,分组聚集操作是一种数据密集型负载.在内存数据库和GPU数据库应用场景下不仅需要研究其性能优化技术,还需要研究如何优化分配分组聚集计算执行场地以最小化CPU与GPU之间的数据传输代价.针对异构计算平台的硬件特征提出了向量聚集计算技术,将位于传统流水线末端的分组聚集计算按照"早分组,晚聚集"策略进行分解与下推,实现将数据密集型的分组聚集计算从流水线中分离,将操作与处理器计算特性优化匹配,实现异构计算平台上最优的负载分配.通过将传统基于哈希分组的聚集计算转换为向量分组聚集计算,显著提升了分组聚集计算性能.实验结果表明,向量分组聚集技术相对于具有代表性的高性能内存数据库Hyper、GPU数据库MapD最大达到5~8倍的性能提升.向量聚集计算不仅提高了OLAP聚集计算性能,而且实现了将数据密集型负载从查询计划中分离的目标,使异构计算平台能够根据处理器的硬件特性优化配置计算资源,提高异构计算平台OLAP的整体性能.
CPU-GPU异构计算平台、向量分组聚集、分组向量索引、数据密集型负载
57
TP311(计算技术、计算机技术)
国家自然科学基金;北京市自然科学基金
2021-06-15(万方平台首次上网日期,不代表论文的发表时间)
共11页
84-94