期刊专题

杂合启发式在线POMDP规划*

引用
  许多不确定环境下的自主机器人规划任务都可以用部分可观察的马氏决策过程(partially observable Markov decision process,简称POMDP)建模。尽管研究者们在近似求解技术的设计方面已经取得了显著的进展,开发高效的 POMDP 规划算法依然是一个具有挑战性的问题。以前的研究结果表明:在线规划方法能够高效地处理大规模的 POMDP 问题,因而是一类具有研究前景的近似求解方法。这归因于它们采取的是“按需”作决策而不是预前对整个状态空间作决策的方式。旨在通过设计一个新颖的杂合启发式函数来进一步加速 POMDP 在线规划过程,该函数能够充分利用现有算法里一些被忽略掉的启发式信息。实现了一个新的杂合启发式在线规划(hybrid heuristic online planning,简称HHOP)算法。在一组POMDP基准问题上,HHOP有明显优于现有在线启发式搜索算法的实验性能。

部分可观察的马氏决策过程、在线规划、杂合启发法

TP181(自动化基础理论)

国家自然科学基金60745002,61175057;国家高技术研究发展计划8632008AA01Z150

2013-08-23(万方平台首次上网日期,不代表论文的发表时间)

共12页

1589-1600

相关文献
评论
暂无封面信息
查看本期封面目录

软件学报

1000-9825

11-2560/TP

2013,(7)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn