10.13338/j.issn.1674-649x.2024.04.002
深度确定性策略梯度下运动目标识别及无人机跟随
针对无人机(unmanned aerial vehicle,UAV)平台采集运动目标图像信息过程中因UAV自身的飞行状态、环境的干扰、目标的随机性等原因易产生运动目标丢失等问题,提出了一种基于运动目标识别的深度确定性策略梯度(deep deterministic policy gradient,DDPG)算法UAV跟随方法.面向高速公路的车辆目标,分析了 UAV高度、位姿与高速车辆运动之间的关系,建立了移动平台目标检测帧率的速度自适应模型,根据目标的运动状态计算能够相匹配UAV的飞行状态,实时修正飞行姿态与速度,使UAV能够保持与目标的相对位置和角度.继而基于DDPG算法价值网络估计UAV在不同状态下采取特定动作的价值,策略网络生成UAV在给定状态下采取动作的策略,给予UAV飞行高度、速度控制参数用于目标跟踪,使UAV能够根据目标的运动变化自动调节飞行状态,实现运动目标的自适应跟随.仿真实验表明:DDPG算法能够提供稳定的飞行姿态数据,为UAV的跟随任务提供了可靠的控制基础;通过在真实场景下实验验证,UAV能够实时跟踪速度范围0~33 m/s、半径为120 m的圆形面积内的地面运动目标,且在续航范围内能够实现持续稳定跟随.
四轴飞行器、高速公路、动态规划、深度确定性策略梯度、目标跟踪
38
TP273(自动化技术及设备)
陕西省自然科学基础研究计划项目;陕西省教育厅一般专项科学研究计划项目;大学生创新创业训练计划项目
2024-10-10(万方平台首次上网日期,不代表论文的发表时间)
共9页
9-17