10.3778/j.issn.1002-8331.1908-0254
基于深度强化学习的股市操盘手模型研究
股票市场具有变化快、干扰因素多、周期数据不足等特点,股票交易是一种不完全信息下的博弈过程,单目标的监督学习模型很难处理这类序列化决策问题.强化学习是解决该类问题的有效途径之一.提出了基于深度强化学习的智能股市操盘手模型ISTG(Intelligent Stock Trader and Gym),融合历史行情数据、技术指标、宏观经济指标等多数据类型,分析评判标准和优秀控制策略,加工长周期数据,实现可增量扩展不同类型数据的复盘模型,自动计算回报标签,训练智能操盘手,并提出直接利用行情数据计算单步确定性动作值的方法.采用中国股市1400多支的有10年以上数据的股票进行多种对比实验,ISTG的总体收益达到13%,优于买入持有总体?7%的表现.
深度强化学习、双价值网络的深度强化学习(DDQN)、单步确定性动作值、量化策略
56
TP242.6(自动化技术及设备)
2020-11-12(万方平台首次上网日期,不代表论文的发表时间)
共9页
145-153