10.3969/j.issn.1003-9767.2020.15.026
基于马尔科夫决策的网络故障模型


马尔科夫决策过程MDP是一种强化学习的基本框架,通过对马尔科夫决策过程采用的时间差分TD算法、神经网络反向传播BP算法和遗传算法等强化学习算法的研究及结合现实中复杂的网络故障,构造了一种解决复杂网络故障的智能体强化学习的网络故障模型.通过该模型能够智能诊断和预测复杂的网络故障,为快速抢通恢复网络故障提供了重要的智能手段.
时间差分TD算法、神经网络反向传播BP算法、遗传算法
32
TP183(自动化基础理论)
2021-03-03(万方平台首次上网日期,不代表论文的发表时间)
共3页
70-72