10.11959/j.issn.2096-0271.2021052
基于优化反馈的组合在线学习
组合在线学习问题研究如何在与环境的交互过程中学习未知参数,逐步找到最优的目标组合.该问题有丰富的应用场景,如广告投放、搜索和推荐等.首先阐述了组合在线学习问题的定义及其框架——组合多臂老虎机问题,归纳了此框架下的经典算法和研究进展;然后具体介绍了该问题的两个实际应用——在线影响力最大化和在线排序学习问题,以及其研究进展;最后展望了组合在线学习问题的未来研究方向.
组合多臂老虎机;在线学习;在线影响力最大化;在线排序学习
7
TP181(自动化基础理论)
国家自然科学基金资助项目;上海市青年科技英才扬帆计划
2021-10-12(万方平台首次上网日期,不代表论文的发表时间)
共20页
111-130