位置:成果数据库 > 期刊 > 期刊详情页
基于平均报酬模型的强化学习算法研究
  • ISSN号:1007-6735
  • 期刊名称:《上海理工大学学报》
  • 时间:0
  • 分类:TP24[自动化与计算机技术—控制科学与工程;自动化与计算机技术—检测技术与自动化装置]
  • 作者机构:[1]上海交通大学电子信息与电气工程学院,上海200030, [2]上海交通大学机械与动力工程学院,上海200030, [3]华东理工大学信息科学与工程学院,上海200237
  • 相关基金:国家自然科学基金资助项目(50305021)
中文摘要:

对于有吸收目标状态的循环任务,比较合理的方法是采用基于平均报酬模型的强化学习.平均报酬模型强化学习具有收敛速度快、鲁棒性强等优点.本文介绍了平均报酬模型强化学习的3个主要算法:R学习、H学习和LC学习,并给出了平均报酬模型强化学习的主要应用及研究方向.

英文摘要:

It is rational to adopt the average reward reinforcement learning algorithms for solving the absorbing goal states cyclical tasks: It has the merit of converging quickly and robustly. A detailed study as regards average reward reinforcement learning including R-learning, H-learning and LC-learning is presented and the application and future research are proposed.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《上海理工大学学报》
  • 北大核心期刊(2011版)
  • 主管单位:上海市教育委员会
  • 主办单位:上海理工大学
  • 主编:庄松林
  • 地址:上海市军工路516号489信箱
  • 邮编:200093
  • 邮箱:xbzrb@USST.edu.cn
  • 电话:021-55277251
  • 国际标准刊号:ISSN:1007-6735
  • 国内统一刊号:ISSN:31-1739/T
  • 邮发代号:4-401
  • 获奖情况:
  • 上海市高等学校优秀自然科学学报一等奖,1999年获全国优秀高等学校自然科学学报及教育部优...,1995年获机械工业部优秀科技期刊三等奖
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国化学文摘(网络版),荷兰文摘与引文数据库,美国剑桥科学文摘,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:5359