位置:成果数据库 > 期刊 > 期刊详情页
基于CMAC网络强化学习的电梯群控调度
  • ISSN号:0372-2112
  • 期刊名称:《电子学报》
  • 时间:0
  • 分类:TP18[自动化与计算机技术—控制科学与工程;自动化与计算机技术—控制理论与控制工程]
  • 作者机构:[1]南京大学软件新技术国家重点实验室,江苏南京210093
  • 相关基金:国家自然科学基金(No.60475026);国家杰出青年科学基金(No.60325207);国家973重点基础研究发展规划(No.2002CB312002)
中文摘要:

电梯群控调度是一类开放、动态、复杂系统的多目标优化问题.目前应用于群控电梯调度的算法主要有分区算法、基于搜索的算法、基于规则的算法和其他一些自适应的学习算法.但已有方法在顾客平均等待时间等目标上并不能够达到较好的优化性能.本文采用强化学习技术应用到电梯群控调度系统中,使用CMAC神经网络函数估计模块逼近强化学习的值函数,通过耻学习算法来优化值函数,从而获得优化的电梯群控调度策略.通过仿真实验表明在下行高峰模式下,本文所提出的基于CMAC网络强化学习的群控电梯调度算法,能够有效地减少平均等待时间,提高电梯运行效率.

英文摘要:

Elevator group control is a multi-objective optimization problem in an open, complicated and dynamical system. Currently,many algorithms have been applied in elevator group control, such as zoning approaches, search-based approaches,rulebased approaches and other adaptive approaches. However these methods fail of achieving the optimal performance in the average wait time. In this paper, the reinforcement learning technology is applied in the elevator group control system. The CMAC neural network is used to approx the value function of reinforcement learning and Q-learning algorithm is used to optimize the value function,thereby the optimal control policy of the elevator group control is achieved. The simulation experiment shows that the elevator group control using reinforcement learning with CMAC can reduce the average wait time efficiently in the down peak Waffle.

同期刊论文项目
期刊论文 49 会议论文 36 获奖 7 著作 4
同项目期刊论文
期刊信息
  • 《电子学报》
  • 中国科技核心期刊
  • 主管单位:中国科学技术协会
  • 主办单位:中国电子学会
  • 主编:郝跃
  • 地址:北京165信箱
  • 邮编:100036
  • 邮箱:new@ejournal.org.cn
  • 电话:010-68279116 68285082
  • 国际标准刊号:ISSN:0372-2112
  • 国内统一刊号:ISSN:11-2087/TN
  • 邮发代号:2-891
  • 获奖情况:
  • 2000年获国家期刊奖,2000年获国家自然科学基金志项基金支持,中国期刊方阵“双高”期刊
  • 国内外数据库收录:
  • 美国化学文摘(网络版),荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),英国英国皇家化学学会文摘,中国北大核心期刊(2000版)
  • 被引量:57611