一种递归神经网络的学习型电梯群控派梯算法
设计了一种借助历史数据自主学习的电梯群控调度算法,算法利用了增强学习技术在历史经验中的不断试错而获得最佳策略.以马尔可夫决策过程作为电梯派送问题的数学模型,进而将一种内在递归神经网络与增强学习中的Q-learning方法结合,所得电梯群控调度算法通过迭代得到近似的最佳状态行为值函数及对应的决策结果,实现优化派梯.通过仿真实验,在不同的交通流设置下,将所提出的派梯算法与其他几种传统派梯方法进行比较,仿真测试结果验证了该算法的有效性和优越性.
电梯群控、派梯算法、增强学习、马尔可夫决策过程、递归神经网络
42
TP18(自动化基础理论)
河北省高等学校科学研究计划Z2012016;天津市科委科研计划20120833
2016-09-18(万方平台首次上网日期,不代表论文的发表时间)
共7页
7-13