10.16097/j.cnki.1009-6744.2024.04.011
基于生成对抗模仿学习的路段非机动车行为仿真
为精准复现路段非机动车干扰行为,满足自动驾驶仿真测试需求,本文提出一种位置奖励增强的生成对抗模仿学习(Position Reward Augmented Generative Adversarial Imitation Learning,PRA-GAIL)方法训练仿真模型.城市道路中,干扰行为主要由电动自行车产生,故以电动自行车作为研究对象.在构建的仿真环境中,使用生成对抗模仿学习(GAIL)更新仿真模型使仿真轨迹逐步逼近真实轨迹,同时加入位置奖励与Lagrangian约束方法以解决现有仿真方法中的均质化和行为不可控的问题.结果表明:在测试集表现上,GAIL和PRA-GAIL方法平均每步长距离误差相比于常用的行为克隆方法下降了61.7%和65.8%.在行为层仿真精度上,与GAIL相比,PRA-GAIL的加速度分布与真实分布间的KL散度显著降低,越线、超车数量的百分比误差下降了7.2%和20.2%.使用Lagrangian方法添加安全约束使有危险行为的智能体数量相比于常用的奖励增强方法下降了75.8%.在轨迹层仿真精度上,整体仿真环境下,PRA-GAIL的平均每步长距离误差相比于GAIL下降了17.5%.本文模型真实再现了非机动车超车时的操作空间,说明PRA-GAIL方法对非机动车行为仿真有良好的适用性.本文提出的改动有效提升了仿真效果,最终所得的仿真模型能够真实地再现路段非机动车的干扰行为,能够应用于自动驾驶仿真测试.
交通工程、非机动车行为、强化学习、生成对抗模仿学习、自动驾驶测试、微观交通仿真
24
U491.2(交通工程与公路运输技术管理)
2024-09-02(万方平台首次上网日期,不代表论文的发表时间)
共11页
105-115