10.3969/j.issn.1001-4268.2000.01.008
非时齐向量值马氏决策模型
章云等[2]讨论了一类报酬函数绝对平均相对有界的非时齐向量值马氏决策模型(简记为VMDP.得出了一最优策略存在的充分条件,并讨论了强最优和最优的关系,张升等[3]导出了该模型的内个质.本文讨论在满足一类报酬函数绝对平均相对有界条件下的非时齐VMDP,将非时齐标量值决策模型的主要结论(策略是最优策略的充要条件,最优方程,马氏策略优势等)在此作了推广.
非时齐、向量值马氏决策、最优方程、马氏策略优势
16
O21(概率论与数理统计)
2004-01-08(万方平台首次上网日期,不代表论文的发表时间)
共9页
57-65