基于深度期望Q网络算法的微电网能量管理策略
随着光伏发电在微电网中的渗透率不断提高,其发电出力的不确定性和时变性为微电网的经济运行带来了挑战.在构建经济调度模型时,就需要适当模拟不确定变量并相应地发展高效求解算法.在此背景下,文中提出能够有效计及不确定性因素的深度强化学习算法,以实时求解微电网的优化运行问题.首先,采用马尔可夫决策过程对微电网优化运行问题进行建模,用实时奖励函数代替目标函数和约束条件,利用其与环境互动,寻找最优策略.其次,借助贝叶斯神经网络对不确定的学习环境建模,进而在马尔可夫决策过程中有效考虑状态转移的随机过程.为此,提出双深度期望Q网络算法,通过考虑状态转移的随机性,优化一般深度Q网络算法的Q迭代规则,显著提高算法的收敛速度.最后,采用算例验证了所提模型和算法的有效性.
光伏发电;不确定性建模;深度强化学习;贝叶斯神经网络;双深度期望Q网络
46
国家自然科学基金;NSFC-山西煤基低碳联合基金
2022-02-25(万方平台首次上网日期,不代表论文的发表时间)
共9页
14-22