从规划解中学习一阶派生谓词规则

引用

摘要：

派生谓词是描述动作非直接效果的主要方式.但是由人类专家设计的派生谓词规则(即领域理论)不能保证总是正确或者完备的,因此有时很难解释一个观察到的规划解为什么是有效的.结合归纳学习与分析学习的优点,文中提出一种称为FODRL(First-Order Derived Rules Learning)的算法,在不完美的初始领域理论的引导下从观察到的规划解中学习一阶派生谓词规则.FODRL基于归纳学习算法FOIL(First-Order Inductive Learning),最主要的改进是可以使用派生谓词的激活集来扩大搜索步,从而提高学习到的规则的精确度.学习过程分为两个步骤:先从规划解中提取训练例,然后学习能够最好拟合训练例和初始领域理论的一阶规则集.在PSR和PROME-LA两个派生规划领域进行实验,结果表明,在大部分情况下FODRL比FOIL(甚至包括其变型算法FOCL)学习到的规则的精确度都要高.

关键词：人工智能、智能规划、派生谓词规则、归纳学习、激活集

所属期刊栏目：33

分类号：TP182(自动化基础理论)

资助基金：国家自然科学基金60173039;广东工业大学博士启动基金项目093032

在线出版日期：2010-04-21（万方平台首次上网日期，不代表论文的发表时间）

页数：共16页

页码：251-266

英文信息展示

期刊专题