模型自由的离散时间系统的随机线性二次最优控制

引用

摘要：

针对模型自由的随机线性离散时间系统,通过Q学习算法求解无限时间随机线性二次最优控制问题.首先根据贝尔曼最优性原理定义Q函数,通过值迭代算法的思想构造Q学习算法;其次给出Q学习算法的等价形式并证明其收敛性;最后通过一个仿真实例说明Q学习算法的有效性.

关键词：Q学习算法、值函数、随机线性二次最优控制、随机代数方程

所属期刊栏目：36

分类号：TP273.1(自动化技术及设备)

资助基金：教育部基本科研业务项目N140404004

在线出版日期：2017-01-17（万方平台首次上网日期，不代表论文的发表时间）

页数：共5页

页码：64-68

英文信息展示

期刊专题