航天器姿态稳定强化学习鲁棒最优控制方法
针对外部干扰力矩作用下的刚体航天器姿态稳定最优控制问题,提出了一种在线强化学习的智能鲁棒控制方法.该方法基于自适应动态规划框架,设计单Critic神经网络在线地学习无干扰作用的航天器的最优姿态控制律,并设计一种新的自适应律在线估计Critic 神经网络的权值,实现了近似最优的控制性能.在学习的近似最优控制律的基础上,嵌入鲁棒控制量,形成鲁棒智能控制器,并应用Lyapunov理论证明了闭环姿态控制系统是一致最终有界稳定的,且Critic 神经网络的权值估计误差是收敛的.相比于采用Actor-Critic神经网络结构的自适应动态规划方法,该方法一方面削弱了对持续激励条件的依赖,另一方面降低了计算复杂度,并保证了姿态稳定控制性能对外部干扰具有较强的鲁棒性.
航天器、姿态控制、强化学习、自适应动态规划、外部干扰、鲁棒性
45
V249.1(航空仪表、航空设备、飞行控制与导航)
2024-02-02(万方平台首次上网日期,不代表论文的发表时间)
共15页
51-65