布洛托上校博弈模型及求解方法研究进展
对抗条件下的资源分配是大多数博弈决策问题的核心.从拟合最优解到博弈均衡解,基于博弈论的资源分配策略求解是认知决策领域的前沿课题.文中围绕对抗条件下资源分配的布洛托上校博弈模型和求解方法展开综述分析.首先,简要介绍了离线与在线策略学习的区别,策略博弈与相关解概念,在线优化与遗憾值;其次,梳理了 6类布洛托上校博弈典型模型(连续布洛托上校博弈、离散布洛托上校博弈、广义布洛托上校博弈、广义乐透布洛托博弈、广义规则布洛托上校博弈与在线离散布洛托上校博弈);然后,区分2个阶段(离线与在线)3类博弈场景(单次、重复、多阶段),分析了多类布洛托上校博弈求解方法;最后,从典型应用探索、广义博弈模型、博弈求解方法、未来研究展望共4方面进行了未来研究前沿分析及展望.通过对当前布洛托上校博弈进行概述,期望能为对抗条件下资源分配与博弈论相关领域的研究带来启发.
资源分配、布洛托上校博弈、近似纳什均衡、在线凸优化、期望遗憾、高概率遗憾
51
TP181(自动化基础理论)
2024-01-23(万方平台首次上网日期,不代表论文的发表时间)
共15页
84-98