期刊专题

10.11959/j.issn.2096-0271.2021052

基于优化反馈的组合在线学习

引用
组合在线学习问题研究如何在与环境的交互过程中学习未知参数,逐步找到最优的目标组合.该问题有丰富的应用场景,如广告投放、搜索和推荐等.首先阐述了组合在线学习问题的定义及其框架——组合多臂老虎机问题,归纳了此框架下的经典算法和研究进展;然后具体介绍了该问题的两个实际应用——在线影响力最大化和在线排序学习问题,以及其研究进展;最后展望了组合在线学习问题的未来研究方向.

组合多臂老虎机;在线学习;在线影响力最大化;在线排序学习

7

TP181(自动化基础理论)

国家自然科学基金资助项目;上海市青年科技英才扬帆计划

2021-10-12(万方平台首次上网日期,不代表论文的发表时间)

共20页

111-130

暂无封面信息
查看本期封面目录

大数据

2096-0271

10-1321/G2

7

2021,7(5)

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn