基于5要素试错更新算法SARSA(λ)的自动发电控制
本文提出了一种基于5要素试错更新算法SARSA(λ)强化学习的随机最优自动发电控制方法.该方法不依赖任何系统模型和先验知识并通过试错机理寻求最优控制策略.以控制性能标准(control performance standards,CPS)和区域控制偏差(areal control error,ACE)瞬时滚动值为基础设计了即时奖励函数,有效提高了该方法的收敛速度和控制效果,并在算法中融入了资格迹以解决二次调频过程的延时问题.本文所提出的控制方法在进行状态空间搜索时,能有效摆脱避免搜索较大扰动状态,以此获得更佳的控制效果.标准两区域和南方电网仿真模型研究表明,本算法能给系统提供更加安全的控制策略,具有比Q(λ)算法更好的控制性能,有效提高CPS考核的合格率.
SARSA(λ)算法、自动发电控制、强化学习、控制性能标准(CPS)
30
TP71(遥感技术)
国家高技术研究发展计划"863"计划资助项目2012AA050209;国家自然科学基金资助项目51177051;中央高校基本业务费重点资助项目2012ZZ0020
2013-11-29(万方平台首次上网日期,不代表论文的发表时间)
共6页
1246-1251