基于Markov决策过程的电池储能一次调频能量管理策略
一次调频市场机制下的电池储能系统能量管理,需要在维持应对频率波动双向调节能力的基础上权衡运行成本和调频收益,以追求电池生命周期内的经济效益最大化.揭示了能量管理序贯决策本质上属于受控Markov过程,据此,通过频率响应需求动态转移的连续时间Markov链描述,以及基于生命周期吞吐量角度的储能电池容量动态衰退刻画,建立了以电池生命周期内经济效益期望值最大化为目标的Markov决策模型.针对运用标准迭代算法求解上述模型所面临的“维数灾”问题,提出了具有状态空间分解及后继状态辨识特征的降维并行值迭代(DRPVI)算法.算例结果表明:所得动态阈值结构能量管理策略可以显著提升储能经济效益,DRPVI算法能够有效缩减冗余计算,改善求解效率.
一次调频、电池储能系统、能量管理策略、Markov决策过程、辅助服务
43
国家自然科学基金资助项目51677018;国家电网公司科技项目2018ZX-14
2019-11-01(万方平台首次上网日期,不代表论文的发表时间)
共10页
77-86