10.3969/j.issn.1002-137X.2013.04.057
Markov决策过程不确定策略特征模式
马尔科夫决策过程可以建模具有不确定性特征的复杂系统,而在进行模型分析时需要采用策略对不确定性进行处理.首先,研究不同策略下时空有界可达概率问题,给出不确定性解决策略的定义及分类方法.其次,在时间无关策略下,证明基于确定性选取动作和随机选取动作的时空有界可达概率的一致性,并且论证了时间依赖策略相对于时间无关策略具有更好的时空有界可达概率.最后结合实例简要阐述了结论的正确性.
马尔科夫决策过程、不确定性策略、时空有界可达概率
40
TP301(计算技术、计算机技术)
国家自然科学基金资助项目60873195,61070220;高等学校博士点基金资助项目20090111110002
2013-06-27(万方平台首次上网日期,不代表论文的发表时间)
共4页
263-266