10.3969/j.issn.1002-137X.2009.09.042
双马尔可夫决策过程联合模型
人类在处理问题中往往分为两个层次,首先在整体上把握问题,即提出大体方案,然后再具体实施.也就是说人类就是具有多分辨率智能系统的极好例子,他能够在多个层次上从底向上泛化(即看问题角度粒度变"粗",它类似于抽象),并且又能从顶向下进行实例化(即看问题角度变"细",它类似于具体化).由此构造了由在双层(理想空间即泛化和实际空间即实例化)上各自运行的马尔可夫决策过程组成的半马尔可夫决策过程,称之为双马尔可夫决策过程联合模型.然后讨论该联合模型的最优策略算法,最后给出一个实例说明双马尔可夫决策联合模型能够经济地节约"思想",是运算有效性和可行性的一个很好的折中.
马尔可夫决策过程、增强学习、最优策略
36
TP18(自动化基础理论)
国家自然科学基金90412014,60803061;江苏省自然科学基金BK2008293
2009-11-10(万方平台首次上网日期,不代表论文的发表时间)
共6页
161-166