一种集成学习辅助DDPG的资源优化算法
为了解决任务调度和资源分配的联合优化问题,构建了包括通信、计算和缓存(3C)的体系架构.为协调网络功能,动态分配有限的3C资源,采用深度确定性策略梯度(DDPG)算法,结合用户请求业务的多样性和动态的无线信道条件,获得移动虚拟网络运营商的最大利润函数.仿真结果表明,基于DDPG算法的资源分配方案明显优于其他2 种方案.集成学习辅助DDPG算法的收敛速度更快,性价比更高.
网络切片、资源分配、深度强化学习、集成学习
46
TN929.5
国家自然科学基金61871058
2023-05-25(万方平台首次上网日期,不代表论文的发表时间)
共8页
29-36