DOI：10.3969/j.issn.1002-087X.2023.02.028

基于专家示范深度强化学习的光伏系统MPPT控制

引用

摘要：

提出一种基于专家示范的深度确定性策略梯度算法(ED-DDPG)的MPPT算法,该算法将最大功率点跟踪问题转化为马尔科夫决策过程(MDP),选择基于连续动作空间的深度确定性策略梯度算法(DDPG)训练MPPT控制算法,来提高输出电压的控制精度,并基于专家示范改进了DDPG算法,使其在强化学习算法的经验池中预先加入传统方法的经验,从而加快算法神经网络训练的收敛速度.该算法解决了传统MPPT算法在面对温度、光照不断变化的复杂环境下动态效率较低的问题,解决了深度确定性策略梯度算法(DDPG)在求解MPPT问题时训练时间过长、收敛难度较大的问题.算例表明该算法在EN50530 标准下MPPT动态效率平均达到97.3％,具有较强的鲁棒性.

关键词：复杂环境、MPPT、DDPG、专家示范、MDP

所属期刊栏目：47

分类号：TM615(发电、发电厂)

在线出版日期：2023-03-30（万方平台首次上网日期，不代表论文的发表时间）

页数：共6页

页码：265-270

英文信息展示

期刊专题