期刊专题

10.13338/j.issn.1674-649x.2023.04.012

结合先验知识与深度强化学习的机械臂抓取研究

引用
在应用深度强化学习(deep reinforcement learning,DRL)实现机械臂自主行为决策过程中,高维连续的状态-动作空间易引起数据采样效率低及经验样本质量低,最终导致奖赏函数收敛速度慢、学习时间长.针对此问题,提出一种引入先验知识的DRL模型.该模型与机械臂逆运动学相结合,在DRL采样阶段引入先验知识指导智能体(Agent)采样,解决学习过程中的数据采样效率低、经验样本质量低的问题;同时通过网络参数迁移的方式验证引入先验知识的DRL模型在面对新任务时仍具有较强的泛化能力;最后,利用Python和CoppeliaSim仿真平台进行联合仿真实验.结果表明:引入先验知识的DRL模型比原始模型的学习效率提升了13.89%、12.82%,完成任务的成功率提高了16.92%、13.25%;在新任务中,学习率提升了23.08%、23.33%,成功率提高了10.7%、11.57%.

机械臂、先验知识、深度强化学习、网络迁移

37

TP242.6;TP399(自动化技术及设备)

国家自然科学基金;国家自然科学基金;泰州市科技计划项目

2023-09-26(万方平台首次上网日期,不代表论文的发表时间)

共10页

92-101

相关文献
评论
暂无封面信息
查看本期封面目录

西安工程大学学报

1674-649X

61-1471/N

37

2023,37(4)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn