期刊专题

10.11959/j.issn.2096-8930.2023002

基于多智能体深度强化学习的测运控一体化资源调度方法

引用
随着卫星通信技术的发展,星座规模的不断扩大,测运控一体化成为主流趋势.星座规模大、调度对象多、复杂操作联合控制给卫星网络测运控一体化资源调度带来巨大的挑战.受制于调度算法求解效率低、约束复杂等问题,传统的测运控资源调度技术采用提前上注测控指令,按照固定部署执行任务,难以满足突发事件与紧急任务的调度需求.因此,提出一种基于多智能体演员-评判家确定性策略梯度算法的测运控一体化资源调度方法,采用集中式训练和分布式执行的方法,建立测运控一体化任务的多智能体模型,通过分析邻居智能体局部信息计算调度策略,提高任务的响应速度.依据测运控一体化资源调度问题中的模型和约束,选择影响意义大、可解释的约束,建立多智能体资源调度强化学习模型,并进行仿真测试.测试结果显示,该方法的任务收益较传统方法提高22%.

测运控一体化、大规模星座系统、资源调度、多智能体深度强化学习、任务收益

4

V19(航空、航天的应用)

国家重点研发计划;国家自然科学基金;秦创原引用高层次创新创业人才项目

2023-04-03(万方平台首次上网日期,不代表论文的发表时间)

共11页

12-22

暂无封面信息
查看本期封面目录

天地一体化信息网络

2096-8930

10-1706/TN

4

2023,4(1)

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn