10.3969/j.issn.1671-1815.2019.30.036
基于时空特征融合的端到端无人车控制
基于深度学习的端到端车辆控制器多是由二维卷积神经网络(2D convolutional neural netuark,2D CNN)训练得到的,因未考虑时间维度上的帧间运动信息,使得控制器的可解释性与泛化能力较差,而三维卷积神经网络(3D CNN)可以从连续视频帧中学习时空特征.深度确定性策略梯度强化学习(depth deterministic policy gradient,DDPG)常用于连续动作的控制优化,但DDPG算法仍存在采样方式不合理而导致的样本利用率低的问题.基于此,采用3D CNN与改进DDPG算法相结合的方法对车辆方向盘转角和速度进行预测.通过实车实验实现了车辆在所设置轨道上的自主驾驶,为基于深度学习和强化学习方法解决自动驾驶中的端到端控制问题提供了科学方法.
卷积神经网络、端对端控制器、强化学习、自动驾驶
19
TP391.7(计算技术、计算机技术)
国家自然科学基金51965008;贵州省优秀青年科技人才项目[2017]5630;贵州省科技厅支撑项目[2018]2168
2019-12-19(万方平台首次上网日期,不代表论文的发表时间)
共6页
241-246