位置:成果数据库 > 期刊 > 期刊详情页
群体环境下基于随机对策的多Agent局部学习算法
  • ISSN号:1002-0411
  • 期刊名称:《信息与控制》
  • 时间:0
  • 分类:TP391.9[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]北京科技大学信息工程学院,北京100083
  • 相关基金:基金项目:国家自然科学基金资助项目(60503024,60374032)
中文摘要:

基于群体环境中个体agent局部感知和交互的生物原型,提出一种随机对策框架下的多agent局部学习算法.算法在与局部环境交互中采用贪婪策略最大化自身利益.分别在零和、一般和的单个平衡点和多个平衡点情形下改进了Nash-Q学习算法;提出了行为修正方法,并证明了算法收敛、计算复杂度降低.

英文摘要:

A local learning algorithm for multi-agent-based stochastic games is proposed in light of the fact that the individual performs local perception and interaction in group. In the algorithm, every agent adopts greedy policy to maximize- its payoff when interacting with the environment. The Nash-Q earning algorithm is improved respectively in situations of zero-sum, general-sum games with only one equilibrium or multi-equilibrium. Besides, the method to modify the behavior is proposed, and it is proved that the algorithm is convergent and the computing complexity is reduced.

同期刊论文项目
期刊论文 108 会议论文 28 著作 1
期刊论文 44 会议论文 3 著作 3
同项目期刊论文
期刊信息
  • 《信息与控制》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学院
  • 主办单位:中国自动化学会 中国科学院沈阳自动化研究所
  • 主编:王天然
  • 地址:沈阳市南塔街114号
  • 邮编:110016
  • 邮箱:xk@sia.cn
  • 电话:024-23970049
  • 国际标准刊号:ISSN:1002-0411
  • 国内统一刊号:ISSN:21-1138/TP
  • 邮发代号:
  • 获奖情况:
  • 全国优秀期刊三等奖,中科院优秀期刊三等奖,辽宁省优秀期刊一等奖
  • 国内外数据库收录:
  • 美国数学评论(网络版),荷兰文摘与引文数据库,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:12960