10.3321/j.issn:0254-4164.1999.06.015
SFT:一个具有较短冻结时间的一致检查点算法
介绍了一个基于消息记录的一致检查点算法--SFT算法.SFT算法能够实现分布式系统的容错.该算法具有无多米诺效应、冻结时间短、开销小和重启动算法简单的优点.SFT的IPC机制基于PVM,能够保证消息的有序到达,并且其消息的发送和接收操作都是原子操作.另外,IPC机制中进程的id值编码与所在机器无关.这样一个进程即使从故障机器迁移到其它机器上运行仍可与其它进程继续通信.为提高检查点操作的并行性,SFT算法在进行检查点操作时不但避免使用全局同步操作,而且使用了主存算法.另外,SFT算法中的控制消息Munblock可以使一个进程在任何时刻都能尽快地响应检查点事件.SFT算法的冻结时间小于0.03s,而且其控制消息的数目仅为O(n).
分布式系统、容错、检查点、冻结时间
22
TP316(计算技术、计算机技术)
国家自然科学基金69673012
2005-08-18(万方平台首次上网日期,不代表论文的发表时间)
共6页
645-650