位置:成果数据库 > 期刊 > 期刊详情页
Cooperative learning with joint state value approximation for multi-agent systems
  • ISSN号:2095-6983
  • 期刊名称:《控制理论与技术:英文版》
  • 时间:0
  • 分类:TP181[自动化与计算机技术—控制科学与工程;自动化与计算机技术—控制理论与控制工程]
  • 作者机构:[1]深圳职业技术学院教育技术与信息中心,广东深圳518055, [2]中南大学信息科学与工程学院,湖南长沙410083, [3]先进控制与智能自动化湖南省工程实验室,湖南长沙410083
  • 相关基金:国家自然科学基金(No.61074058,No.60874042); 深圳市自然科学基金(No.JCYJ20120617134831736)
中文摘要:

针对贝叶斯强化学习中参数个数巨大,收敛速度慢,无法实现在线学习的问题,提出一种基于模型的可分解贝叶斯强化学习方法.首先,将学习参数进行可分解表示,降低学习参数的个数;然后,根据先验知识和观察数据采用贝叶斯方法来学习,最优化探索和利用二者之间的平衡关系;最后,采用基于点的贝叶斯强化学习方法实现学习过程的快速收敛,从而达到在线学习的目的.仿真结果表明该算法能够满足实时系统性能的要求.

英文摘要:

Due to the enormous number of parameters and slow convergence which are the major obstacles for online learn- ing in model-based Bayesian reinforcement learning, the paper presents a model-based factored Bayesian reinforcement learning ap- proach. Firstly, factored representations are made to represent the dynamics with fewer parameters. Then, according to prior knowl- edge and observable data, this paper exploits model-based reinforcement learning to provide an elegant solution to the optimal explo- ration-exploitation tradeoff. Finally, a pointed-based Bayesian reinforcement learning approach is proposed to speed up the conver- gence to achieve online learning. The experimental results show that the proposed approach can approximate the underlying Bayesian reinforcement learning task well with guaranteed real-time performance.

同期刊论文项目
期刊论文 16 会议论文 6 获奖 4 专利 3
同项目期刊论文
期刊信息
  • 《控制理论与技术:英文版》
  • 主管单位:国家教育部
  • 主办单位:华南理工大学 中科院数学与系统科学研究院
  • 主编:胡跃明
  • 地址:广州市天河区五山路381号华南理工大学
  • 邮编:510640
  • 邮箱:jcta@scut.edu.cn
  • 电话:020-87111464
  • 国际标准刊号:ISSN:2095-6983
  • 国内统一刊号:ISSN:44-1706/TP
  • 邮发代号:46-319
  • 获奖情况:
  • 国内外数据库收录:
  • 美国数学评论(网络版),德国数学文摘,荷兰文摘与引文数据库,美国工程索引
  • 被引量:69