面向非易失性存储器的多表连接写操作的优化研究
多表连接操作是嵌入式数据库、数据仓库等系统中的一个重要操作.因此,提升多表连接的性能能够加快数据处理和分析的速度,进而提升系统的整体性能.新型的非易失性存储器(Non-Volatile Memory,NVM)具有内存级读写速度、存储密度高、可字节寻址和持久化等优点,成为补充或替代DRAM的新型存储设备.然而,直接将现有的多表连接算法应用在NVM上会带来两个问题:(1)现有算法不能充分发挥新型非易失性存储器的优势,无法展现较优的性能;(2)连接算法会生成大量中间表,对存储设备造成大量写操作.由于NVM的写耐受度有限,现有多表连接操作极易造成NVM的损坏.该文考虑NVM写耐受度有限的特性,旨在减少多表连接操作引起的对NVM的写操作.首先,该文提出优化连接顺序的NVjoin算法,该算法解析不同表之间的关联性,并通过采样的方法估算中间结果的大小,从而选择较优的连接顺序,尽可能减少NVM上的写操作.其次,该文设计了一个组织中间结果的数据结构——LWTab,该结构充分利用了NVM可字节寻址的特性,通过存储数据的地址而非数据的方式,进一步减少连接过程中中间结果所产生的NVM写操作.该文利用DRAM模拟NVM进行大量的测试实验,结果表明,该文提出的算法在时间性能与NVM写次数两个方面均得到提升:与MySQL所提供的连接顺序相比,NVjoin可以减少104.21倍的NVM写操作并提升65.01%的性能.除此之外,LWTab可以在NVjoin的基础上,进一步减少16.74倍的NVM写操作以及提升71.86%的性能.
非易失性存储器、多表连接、连接顺序、数据库
42
TP311(计算技术、计算机技术)
国家“八六三”高技术研究发展计划项目基金2015AA015304;国家自然科学基金61472052;中国博士后科学基金2017M620412
2019-12-04(万方平台首次上网日期,不代表论文的发表时间)
共12页
2417-2428