10.16708/j.cnki.1000-758X.2023.0045
基于A2C算法的低轨星座动态波束资源调度研究
巨型低轨星座为载人飞船、空间站、遥感卫星等用户航天器提供低时延、大容量的通信通道存在波束资源分配优化的难题.针对采用离散时间的深度强化学习A2C(advanced actor-critic)的智能优化框架进行了研究,结合遗传算法中个体和基因概念、形成了可有效满足多用户、动态、并发接入需求的波束资源调度算法.基于仿真分析,提出的算法可在多种典型场景下具有适用性,支持在20 s内完成超过3000个任务的有效规划,任务成功率不低于91%.通过算法优化实现复杂度的降低,相对传统遗传算法可节约时间45%以上.同时对传统A2C算法框架中的收敛问题进行了优化,解决了传统全连接A2C算法无法收敛的难题,同时相比DQN(deep q-network)算法框架收敛速度提升38%以上.
低轨星座、波束调度、任务规划、深度强化学习、A2C算法
43
V19(航空、航天的应用)
国家重点研发计划;国家自然科学基金
2023-06-09(万方平台首次上网日期,不代表论文的发表时间)
共11页
123-133