10.19850/j.cnki.2096-4706.2021.17.018
计算机博弈算法在黑白棋中的应用
计算机博弈是人工智能的重要分支之一,文章对人工智能算法黑白棋中的应用进行了研究.首先介绍了计算机博弈中的经典黑白棋算法,然后介绍深度强化学习中两种典型的时间差分算法的定义和实现过程,以及两者的区别和联系.最后评测蒙特卡洛树搜索算法、Q学习算法和SARSA算法三种算法在黑白棋实际应用的表现,以及后续改进的方向.
蒙特卡洛树搜索;深度强化学习;马尔科夫决策过程;Q学习;SARSA
5
TP181(自动化基础理论)
广东省教育厅普通高校特色创新类项目2019GKTSCX059
2022-01-12(万方平台首次上网日期,不代表论文的发表时间)
共6页
73-77,81