位置:成果数据库 > 期刊 > 期刊详情页
搬运系统作业分配问题的小脑模型关节控制器Q学习算法
  • ISSN号:1000-8152
  • 期刊名称:《控制理论与应用》
  • 时间:0
  • 分类:TP202[自动化与计算机技术—控制科学与工程;自动化与计算机技术—检测技术与自动化装置]
  • 作者机构:[1]合肥工业大学计算机与信息学院,安徽合肥230009, [2]安全关键工业测控技术教育部工程研究中心,安徽合肥230009
  • 相关基金:国家自然科学基金资助项目(60404009);安徽省自然科学基金资助项目(090412046,070416242);安徽高校省级自然科学研究重点资助项目(KJ2007A063,KJ2008A058);教育部留学回国人员科研启动基金资助项目.
中文摘要:

研究两机器人高速搬运系统的作业分配问题.在系统的Markov决策过程(MDP)模型中,状态变量具有连续取值和离散取值的混杂性,状态空间复杂且存在“维数灾”问题,传统的数值优化难以进行.根据小脑模型关节控制器(CMAC)具有收敛速度快和适应性强的特点,运用该结构作为Q值函数的逼近器,并与Q学习和性能势概念相结合,给出了一种适用于平均或折扣性能准则的CMAC—Q学习优化算法.仿真结果说明,这种神经元动态规划方法比常规的Q学习算法具有节省存储空间,优化精度高和优化速度快的优势.

英文摘要:

The task assignment of a high-speed handling system with two robots is studied in this paper. In the under- lying Markov decision process(MDP) model, the state variable is composed of both continuous and discrete values, and the state space is complex and suffers from the curse of dimensionality. Therefore, the traditional numerical optimization is prevented from successful application to this system. Since the cerebellar-model-articulation-controller(CMAC) has the advantages of fast convergence and desired adaptability, it is employed to approximate the Q-values in a CMAC-Q learning optimization algorithm for combining the concept of performance potential and Q-learning, and for unifying the average criteria with the discount criteria. Compared with the Q-learning, the proposed neuro-dynamic programming approach requires less memory, but provides higher learning speed and better optimization performance as shown in the simulations.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《控制理论与应用》
  • 北大核心期刊(2011版)
  • 主管单位:国家教育部
  • 主办单位:华南理工大学 中国科学院数学与系统科学研究院
  • 主编:胡跃明
  • 地址:广州五山路华南理工大学3号楼516室
  • 邮编:510640
  • 邮箱:aukzllyy@scut.edu.cn
  • 电话:020-87111464
  • 国际标准刊号:ISSN:1000-8152
  • 国内统一刊号:ISSN:44-1240/TP
  • 邮发代号:46-11
  • 获奖情况:
  • 国内外数据库收录:
  • 美国化学文摘(网络版),美国数学评论(网络版),德国数学文摘,荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:21084