位置:成果数据库 > 期刊 > 期刊详情页
基于聚类状态隶属度的动态调度Q-学习
  • ISSN号:1002-0470
  • 期刊名称:《高技术通讯》
  • 时间:0
  • 分类:O24[理学—计算数学;理学—数学]
  • 作者机构:[1]哈尔滨工业大学机电工程学院,哈尔滨150001
  • 相关基金:国家自然科学基金(60572174)和863计划(2008AA042401)资助项目.
中文摘要:

提出了一种利用Q-学习解决动态单机调度环境下的自适应调度规则选择的方法。该方法针对动态调度环境中系统状态空间大,Q-学习不易收敛的特点,首先提取系统状态特征,对系统状态进行合理聚类,有效地降低系统状态空间维数,然后在学习过程中令设备Agent根据瞬时状态向量对各聚类状态的隶属度做出综合判断,选择合适规则,并在每次迭代后根据隶属度将动作奖惩分配给各聚类状态的动作值函数。仿真结果表明,所提Q-学习算法较之传统Q-学习具有更快的收敛速度,提高了设备Agent的动态调度规则选择能力。

英文摘要:

Q-learning was applied to resolution of the adaptive dispatching rule selection problem under dynamic single-machine scheduling environment. Considering that Q-learning is hard to converge due to the large scale of the system state space during dynamic scheduling, the method extracts several state features of the system firstly, so that the dimension of the system state space can be reduced through the fuzzy clustering method. Then the machine agent can choose proper rules based on the transient system state membership of all the clustering system states. Each time after machine agent performs an action, the reward is assigned to all the value functions of the same rule in different clustering system states according to the fuzzy membership. The simulation results demonstrate that the proposed algorithm has a faster convergence rate, compared with the traditional Q-learning algorithm, and can improve the dynamic dispatching rule selection ability of machine agent.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《高技术通讯》
  • 北大核心期刊(2011版)
  • 主管单位:中华人民共和国科学科技部
  • 主办单位:中国科学技术信息研究所
  • 主编:赵志耘
  • 地址:北京市三里河路54号
  • 邮编:100045
  • 邮箱:hitech@istic.ac.cn
  • 电话:010-68514060 68598272
  • 国际标准刊号:ISSN:1002-0470
  • 国内统一刊号:ISSN:11-2770/N
  • 邮发代号:82-516
  • 获奖情况:
  • 《中国科学引文数据》刊源,《中国科技论文统计与分析》刊源
  • 国内外数据库收录:
  • 美国化学文摘(网络版),荷兰文摘与引文数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),英国英国皇家化学学会文摘
  • 被引量:12178