期刊专题

10.3969/j.issn.1002-137X.2013.04.057

Markov决策过程不确定策略特征模式

引用
马尔科夫决策过程可以建模具有不确定性特征的复杂系统,而在进行模型分析时需要采用策略对不确定性进行处理.首先,研究不同策略下时空有界可达概率问题,给出不确定性解决策略的定义及分类方法.其次,在时间无关策略下,证明基于确定性选取动作和随机选取动作的时空有界可达概率的一致性,并且论证了时间依赖策略相对于时间无关策略具有更好的时空有界可达概率.最后结合实例简要阐述了结论的正确性.

马尔科夫决策过程、不确定性策略、时空有界可达概率

40

TP301(计算技术、计算机技术)

国家自然科学基金资助项目60873195,61070220;高等学校博士点基金资助项目20090111110002

2013-06-27(万方平台首次上网日期,不代表论文的发表时间)

共4页

263-266

暂无封面信息
查看本期封面目录

计算机科学

1002-137X

50-1075/TP

40

2013,40(4)

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn