10.13334/j.0258-8013.pcsee.213321
知识与深度强化学习融合的家庭需求响应优化
家庭能源系统需求响应(demand response,DR)能够有效促进节能减排.家庭能源系统具有强不确定性,要求DR优化策略具备自动、快速调适能力.该文研究知识与强化学习融合的DR优化方法.首先,建立两者融合的优化框架,形成知识与强化学习互补机制;然后,对家庭设备建模并建立其DR优化知识规则集;进而,以知识转化为学习样本为核心,设计了知识融入强化学习的模型,重点研究知识样本作用概率动态调节、多样化知识、随机探索概率动态调节等问题,并设计知识与DQN融合的算法和网络.算例表明:该文方法能够自动适应家庭的不确定性,用能成本比知识规则法降低11.1%;与标准DQN相比,在同等的收敛标准下,该文方法能源成本低3.3%,且收敛时间仅需标准DQN的1/6.
家庭能源系统、需求响应、不确定性、深度强化学习
43
TM73(输配电工程、电力网及电力系统)
国家重点研发计划;国家自然科学基金
2023-03-15(万方平台首次上网日期,不代表论文的发表时间)
共13页
1855-1866,中插14