本文提出了一种多目标决策与强化学习相结合的改进的逼近于理想解的排序(technique for order preference similar to an ideal solution,TOPSIS)-Q算法,有效解决了自动发电控制(automatic generation control,AGC)总功率指令分配到风电、水电、火电等各类AGC机组的动态随机多目标优化问题.算法采用3个不同的目标Q值矩阵进行迭代更新,然后利用改进TOPSIS方法对Q值矩阵进行多目标决策处理,客观地给出各目标的动态最优权重系数,从而得到各状态-动作对的综合评价判据.IEEE标准两区域模型仿真研究验证了改进TOPSIS-Q算法在AGC机组功率多目标动态优化分配过程应用的可行性和有效性,在复杂随机扰动的环境中提高系统CPS性能的同时,有效降低了AGC机组调节成本和碳排放.
改进TOPSIS-Q、强化学习、多目标优化、AGC功率分配
32
TP71(遥感技术)
国家重点基础研究发展计划“973”计划项目2013CB228205;国家自然科学基金项目51177051,51477055;中国南方电网科技项目资助.Supported by National Key Basic Research Program of China "973" Program2013CB228205;National Natural Science Foundation of China51177051,51477055;Science & Technology Project of China Southern Power Grid Company