基于模型深度强化学习的数据中心主动地板控制
如何消除数据中心的局部热点是困扰数据中心行业的关键问题之一.本文采用主动地板(AVT)来抑制局部机架热点现象,并将数据中心AVT控制问题抽象为马尔可夫决策过程,设计了基于深度强化学习的主动地板最优控制策略.该策略基于模型深度强化学习方法,克服了传统无模型深度强化学习方法采样效率低的缺陷.大量仿真实验结果表明,与经典无模型(PPO)方法相比,所提出的方法可迅速收敛到最优控制策略,并可以有效抑制机架热点现象.
数据中心、主动地板、强化学习、性能评价
39
TP393;O232;G642.0
国家自然科学基金;内蒙古自治区科技重大专项项目;内蒙古自治区科技重大专项项目;内蒙古自治区关键技术攻关计划项目;内蒙古自治区关键技术攻关计划项目;内蒙古自治区科技成果转化专项资金项目;内蒙古自治区科技成果转化专项资金项目
2022-08-09(万方平台首次上网日期,不代表论文的发表时间)
共6页
1051-1056