基于深度强化学习的含需求响应热电联产系统调度优化
针对含需求响应的热电联产系统(CHPs)调度优化问题,提出一种基于深度强化学习(DRL)的调度策略.首先将CHPs调度优化问题建模为马尔科夫决策过程(MDP);其次使用深度Q网络(DQN)算法对CHPs进行优化,在经济性调度的基础上,通过可中断电负荷补偿,引入电力需求响应,以便进一步降低耗能费用;最后通过混合整数线性规划模型(MILP)对DQN算法进行了验证.研究表明:DRL能充分发挥模型的自主性,通过与环境不断交互得到最优动作;通过可中断负荷需求响应,CHPs成本降低了3.50%.
热电联供系统、调度优化、深度强化学习、需求响应
2
TM73(输配电工程、电力网及电力系统)
上海市人保局人才专项;上海市科委项目
2021-07-15(万方平台首次上网日期,不代表论文的发表时间)
共5页
1-5