期刊专题

10.11897/SP.J.1016.2022.00918

基于深度强化学习的智联网汽车感知任务分配

引用
随着智能/辅助/自动驾驶以及电动汽车技术的飞速发展,当前智联网汽车配备越来越多的传感器,拥有越来越强大的计算、存储和通信能力.作为智联网汽车中重要一类,出租车、滴滴等网约车(Mobility-on-demand vehicles)具有城市覆盖规模大和粒度细,以及空闲时间充足的优点.因此,利用这些智联网汽车现有的移动感知设备能够为城市大规模、细粒度、低成本的感知提供很好的机会.本文以出租车、滴滴等这一类重要的智联网汽车为研究对象,重点研究它们的感知任务分配问题,主要面临两方面挑战:一是智联网汽车载客收益(如出租车载客收入)以及汽车/感知任务分布具有时空动态性,导致智联网汽车的感知成本具有高时空动态性且很难建模和学习.二是感知任务的最优分配问题是NP-hard问题,具有指数级时间复杂度.同时,高移动性的智联网汽车对任务的实时分配要求很高.因此,如何对大规模的智联网汽车实现任务的最优实时分配具有挑战性.为了解决这两个挑战,本文提出基于深度强化学习的智联网汽车感知任务分配方法.通过深度强化学习模型对高时空动态性的汽车感知成本进行精确学习,然后基于学习结果进行感知任务的实时最优分配.具体地,针对挑战一,利用基于双注意力机制的循环神经网络挖掘汽车载客收益的时空相关性,并结合驾驶耗费模型,学习智联网汽车的感知成本.针对挑战二,首先通过问题等价转换和理论分析,证明该任务的最优分配问题具有单调子模目标函数和q-独立系统约束条件.然后,基于子模优化理论,联合考虑整体收益和边际效益,提出多项式时间复杂度的近似最优分配算法(近似率为1/「2+Cmax/Cmin]),其中Cmax和Cmin分别表示所有感知成本的最大和最小值.最后,基于两个大规模的智联网汽车数据集(重庆市,约12493辆车;纽约市,约超过1.13亿个行程),对所提方法进行深入全面的评估.实验结果表明,所提方法比7种对比方法平均提高载客收益的预测精度25.1%,提高任务分配的总感知效益37.7%.同时,面向城市道路违规停车监测应用,构建智联网汽车感知原型系统.基于该系统验证了所提方法的可行性和实际应用价值.

智联网汽车、感知任务分配、深度强化学习、子模优化、循环神经网络

45

TP311(计算技术、计算机技术)

国家自然科学基金;国家自然科学基金

2022-05-11(万方平台首次上网日期,不代表论文的发表时间)

共17页

918-934

相关文献
评论
暂无封面信息
查看本期封面目录

计算机学报

0254-4164

11-1826/TP

45

2022,45(5)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn