一种基于扩展数据流分析的OpenMP程序应用级检查点机制
随着多核处理器体系结构在高性能计算领域日益广泛的应用,面向共享存储并行程序的容错问题成为研究的热点.近年来,检查点技术已经成为该领域占主导地位的容错机制.目前已有一些针对OpenMP程序检查点技术的研究工作,但其中绝大多数解决方案都依赖于特殊的运行时库或硬件平台.该文提出一种编译辅助的OpenMP应用级检查点,它是一种平台无关的方案,通过面向OpenMP的扩展数据流分析选择那些"必需"的变量保存到检查点映像,从而降低容错的开销,同时通过运行一种非阻塞式的协议维护检查点的全局一致性.文章讨论了该机制的各个关键问题,并通过实验评测以及与同类工作的比较,表明了该文所提出的检查点机制在容错性能方面的优势.
容错、共享存储、OpenMP、应用级检查点、数据流分析
33
TP302(计算技术、计算机技术)
国家自然科学基金60921062,61003087;国家"八六三"高技术研究发展计划项目基金2009AA01Z102
2011-01-27(万方平台首次上网日期,不代表论文的发表时间)
共14页
1809-1822