基于策略迭代算法的连续时间线性Markov跳变系统 非零和微分反馈Nash控制
针对一类连续时间线性Markov跳变系统,本文提出了一种新的策略迭代算法用于求解系统的非零和微分反馈Nash控制问题.通过求解耦合的数值迭代解,以获得具有线性动力学特性和无限时域二次成本的双层非零和微分策略的Nash均衡解.在每一个策略层,采用策略迭代算法来计算与每一组给定的反馈控制策略相关联的最小无限时域值函数.然后,通过子系统分解将Markov跳变系统分解为N个并行的子系统,并将该算法应用于跳变系统.本文提出的策略迭代算法可以很容易求解非零和微分策略所对应的耦合代数Riccati方程,且对高维系统有效.最后通过仿真示例证明了本文设计方法的有效性和可行性.
策略迭代、Markov跳变线性系统、非零和、微分反馈Nash策略
37
国家自然科学基金项目;安徽省杰出青年基金项目;安徽省高校优秀青年人才支持重点项目
2020-09-23(万方平台首次上网日期,不代表论文的发表时间)
共8页
1749-1756