位置:成果数据库 > 期刊 > 期刊详情页
单交叉口信号配时的离线Q学习模型研究
  • ISSN号:1671-7848
  • 期刊名称:控制工程
  • 时间:2012.12.12
  • 页码:987-992
  • 分类:TP273[自动化与计算机技术—控制科学与工程;自动化与计算机技术—检测技术与自动化装置]
  • 作者机构:[1]长沙理工大学交通运输工程学院,湖南长沙410114
  • 相关基金:基金项目:国家自然科学基金项目(71071024,70701006);教育部科研重点项目(145);湖南省教育厅科研重点项目(09A003,11C0038);长沙市科技局重点项目(K1106004.11,K1001010.11);道路结构与材料交通部重点实验室开放基金项目(kfj100206)
  • 相关项目:消除“车辆混乱”假设的交通流中观模型研究
中文摘要:

为提高交通控制系统的适应性和鲁棒性,采用强化学习方法实现交通控制模型的学习能力。对固定周期和变周期两种模式下的单交叉口信号配时优化进行研究,构造了等饱和度优化目标的奖赏函数,建立了等饱和度和延误最小两个优化目标的离线Q学习模型。采用对流量进行离散的方法解决了状态维数爆炸问题。通过算例对建立的4种离线Q学习模型解的结构、最优解的分布进行分析,结果表明相对于在线Q学习模型,离线Q学习模型更适合交叉151信号配时优化。采用“离线学习,在线应用”的方法,将建立的定周期延误最小离线Q学习模型与Webster定周期模型的性能进行对比,总体上前者的车均延误和累积延误低于后老n

英文摘要:

The development ofa learning model for improving traffic control system adaptability and robustness of the control has an im- portant role. In this paper, we use the reinforcement learning theory to realize the learning ability of traffic control model. The single in- tersection signal timing under fixed cycle and variable cycle has been studied. The paper first proposed the reward function for equal sat- uration principle. Then we proposed the off-line Q-learning models for equal saturation principle and delay minimization goals. The structure of the solutions, and the distribution of the optimal solution of four off-line Q-learning models were analyzed. The paper uses the discretization method of flow rate to solve the dimension explosion. The results show that compared to online Q-learning model, off- line Q-learning model is more suitable for traffic signal timing optimization. Lastly, the paper compares the off-line Q-learning model of delay minimization under fixed cycle and Webster model. The average delay per vehicle and cumulative delay of the former is lower than the latter.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《控制工程》
  • 中国科技核心期刊
  • 主管单位:教育部
  • 主办单位:东北大学
  • 主编:柴天佑
  • 地址:沈阳市东北大学310信箱
  • 邮编:110004
  • 邮箱:kzgcbjb@mail.neu.edu.cn
  • 电话:024-23883498 83688973
  • 国际标准刊号:ISSN:1671-7848
  • 国内统一刊号:ISSN:21-1476/TP
  • 邮发代号:8-216
  • 获奖情况:
  • 国内外数据库收录:
  • 美国剑桥科学文摘,中国中国科技核心期刊,中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:10591