期刊专题

10.3969/j.issn.1002-4956.2013.05.025

百万亿次集群系统的设备管理与系统运维

引用
清华信息科学与技术国家实验室(筹)高性能计算公共平台是清华大学校级公共服务平台之一.建立完备的设备管理方法及高效的系统运维模式是高性能计算平台管理的最基础工作之一.采用自动化与人工管理相结合的方式,建立了完善的设备管理制度保证整个集群设备安全运行;在集群系统运维中,自主开发了集群机自动检测及修复系统,实现了无人值守系统运维模式,保证集群系统的稳定性.目前,设备管理与系统运维系统已经应用于清华“探索100”百万次超级计算系统,为校内外用户提供了稳定、高效的高性能计算环境.

高性能计算平台、设备管理、系统运维

30

TP302(计算技术、计算机技术)

2013-07-10(万方平台首次上网日期,不代表论文的发表时间)

共4页

87-90

相关文献
评论
暂无封面信息
查看本期封面目录

实验技术与管理

1002-4956

11-2034/T

30

2013,30(5)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn