期刊专题

10.16097/j.cnki.1009-6744.2024.04.011

基于生成对抗模仿学习的路段非机动车行为仿真

引用
为精准复现路段非机动车干扰行为,满足自动驾驶仿真测试需求,本文提出一种位置奖励增强的生成对抗模仿学习(Position Reward Augmented Generative Adversarial Imitation Learning,PRA-GAIL)方法训练仿真模型.城市道路中,干扰行为主要由电动自行车产生,故以电动自行车作为研究对象.在构建的仿真环境中,使用生成对抗模仿学习(GAIL)更新仿真模型使仿真轨迹逐步逼近真实轨迹,同时加入位置奖励与Lagrangian约束方法以解决现有仿真方法中的均质化和行为不可控的问题.结果表明:在测试集表现上,GAIL和PRA-GAIL方法平均每步长距离误差相比于常用的行为克隆方法下降了61.7%和65.8%.在行为层仿真精度上,与GAIL相比,PRA-GAIL的加速度分布与真实分布间的KL散度显著降低,越线、超车数量的百分比误差下降了7.2%和20.2%.使用Lagrangian方法添加安全约束使有危险行为的智能体数量相比于常用的奖励增强方法下降了75.8%.在轨迹层仿真精度上,整体仿真环境下,PRA-GAIL的平均每步长距离误差相比于GAIL下降了17.5%.本文模型真实再现了非机动车超车时的操作空间,说明PRA-GAIL方法对非机动车行为仿真有良好的适用性.本文提出的改动有效提升了仿真效果,最终所得的仿真模型能够真实地再现路段非机动车的干扰行为,能够应用于自动驾驶仿真测试.

交通工程、非机动车行为、强化学习、生成对抗模仿学习、自动驾驶测试、微观交通仿真

24

U491.2(交通工程与公路运输技术管理)

2024-09-02(万方平台首次上网日期,不代表论文的发表时间)

共11页

105-115

暂无封面信息
查看本期封面目录

交通运输系统工程与信息

1009-6744

11-4520/U

24

2024,24(4)

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn