10.3969/j.issn.1006-2475.2019.04.009
基于深度Q网络的仿人机器人步态优化
为实现仿人机器人快速稳定的行走,在满足有效参数组合的条件下,提出一种基于深度强化学习的步行参数训练算法以优化机器人步态.首先,从环境中捕获机器人步态模型参数作为DQN的输入;然后,用DQN来拟合机器人行走产生的状态-动作值函数;最后,通过动作选择策略选择当前机器人执行的步态动作,同时产生奖励函数达到更新DQN的目的.选择NAO仿真机器人为实验对象,在RoboCup3D仿真平台上进行实验,结果证明在此算法下,NAO仿人机器人可以获得稳定的双足步行.
仿人机器人、深度强化学习、DQN、步态优化、RoboCup3D
TP242.6(自动化技术及设备)
江苏省水利厅科技计划项目2017003ZB
2019-05-28(万方平台首次上网日期,不代表论文的发表时间)
共6页
47-51,58