东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：成果数据库 > 期刊 > 期刊详情页

群体环境下基于随机对策的多Agent局部学习算法

ISSN号：1002-0411
期刊名称：《信息与控制》
时间：0
分类：TP391.9[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
作者机构：[1]北京科技大学信息工程学院,北京100083
相关基金：基金项目：国家自然科学基金资助项目（60503024,60374032）

作者：尹怡欣[1], 江道平[1], 班晓娟[1], 孟祥嵩[1]

关键词：多AGENT学习, 随机对策, Nash—Q, 局部学习, multi-agent learning, stochastic game, Nash-Q, local Jearning

中文摘要：

基于群体环境中个体agent局部感知和交互的生物原型，提出一种随机对策框架下的多agent局部学习算法．算法在与局部环境交互中采用贪婪策略最大化自身利益．分别在零和、一般和的单个平衡点和多个平衡点情形下改进了Nash-Q学习算法；提出了行为修正方法，并证明了算法收敛、计算复杂度降低．

英文摘要：

A local learning algorithm for multi-agent-based stochastic games is proposed in light of the fact that the individual performs local perception and interaction in group. In the algorithm, every agent adopts greedy policy to maximize- its payoff when interacting with the environment. The Nash-Q earning algorithm is improved respectively in situations of zero-sum, general-sum games with only one equilibrium or multi-equilibrium. Besides, the method to modify the behavior is proposed, and it is proved that the algorithm is convergent and the computing complexity is reduced.

同期刊论文项目

基于人工生命的智能控制系统研究及应用

期刊论文 108 会议论文 28 著作 1

基于认知的人工动物高级行为规划研究

期刊论文 44 会议论文 3 著作 3

同项目期刊论文

基于交互的Agent行为选择动态性分析

一种面向最经济服务流的可视化动态贝叶斯网络模型

广义人工生命概述

基于Agent的人机对话系统的设计与实现

基于服务质量的Web服务发现研究与实现

“软件人”感知系统的协同分类模型研究

一种构造行为动画系统主体的新方法

Compression method based on training dataset of SVM

The Research of Artificial Animal’s Behavior Memory Based on Cognition.

A Kind of Context-aware Computing Approach for Proactive Service

基于多智能体原理的人工鱼交互仿真建模方法

基于模糊推理的人工鱼嗅觉感知研究

软件人情感控制广义模型

情感理论及基于情感的决策理论与模型研究.

基于模糊神经网络的人工鱼虚拟味觉系统研究

A New Approach Supporting Perception Guiding and Multi-objective Decision Making for Behavior Animat

基于记忆的人工鱼认知模型

Interaction model of artificial fish in virtual environment

计算机动画中的虚拟角色路径规划研究

计算机动画环境中基于认知的行为路径选择研究

人工鱼群高级行为的自组织算法与实现

基于人工智能和人工生命的计算机动画

基于认知的人工动物行为记忆研究

Novel method for the evaluation of data quality based on fuzzy control

基于多Agent的人工鱼群自组织行为算法

人工鱼虚拟嗅觉系统的研究

人工鱼“情+智”协调的“意图产生”与“行为控制”

基于PSO智能优化的SFS三维重构算法研究

Multi-SoftMan入侵防御系统模型的智能弹性架构

构件化无缝主动迁移机制中的资源调度策略

人工鱼群高级自组织行为研究

基于XML结构相似性的名老中医病例聚类分析

群体中Agent基于内部状态的行为选择

A MULTI-AGENT LOCAL-LEARNING ALGORITHM UNDER GROUP ENVIROMENT

软件人群体智能自律协调模型研究及应用

A Kind of Context-aware Computing Approach for Proactive Service

个体软件人情感控制模型研究

“软件人”群网络安全风险评估模型的研究

螺杆泵采油过程的动力学控制模型

一种人工鱼群体行为动画的新方法

虚拟环境下人工鱼感知融合模型研究

绩效信息自适应融合的熵模型

一种基于包含度的绩效评价决策方法

多层多维事元可拓集及其运算

基于心理动力机制的移动机器人

人工鱼“情+ 智”协调的“意图产

基于IADS的多库协调器的研究及应

基于一种改进PSO的移动机器人路

基于组件的网络移动机器人软件框

基于交互的Agent行为选择动态性分析

从拟人的角度谈控制系统智能水平

基于人工生命的信息融合开发平台

一种智能控制系统智能水平的评价

基于人工生的拟人感受器

Torsional vibration control of

非线性系统中自调整模糊神经网络

模糊遗传算法在混沌控制中的应用

一类状态时滞系统的最优预见控制

一类不确定大系统的鲁棒指数控制

基于自学习的人工鱼感知系统设计

一种用于最优路径规划的改进遗传

人工生命的研究平台综述

人工鱼群高级行为的自组织算法与

网络环境下虚拟机器人—“软件人

拟人控制系统的结构分析

基于生物功能的拟人控制系统的平

浅谈人工生命与信息理论

基于非线性函数的移动机器人模糊

一种引入通信的多移动机器人编队

一种基于移动机器人AIM的改进的M

软件人协商中的自学习

安全认证技术在“软件人”系统中

Recognition of moving ground t

智能生命随意性行为模型

机制主义下控制系统的拟人特性

智能系统的广义智能的定性评价研

拟人控制系统的概念与体系

智能控制系统智能水平评价的软件

基于神经网络的简单自适应多变量

一种室内环境下移动机器人的路径

不确定广义系统的保性能控制：LM

基于人工生命的气动肌肉

基于Agent的智能人机接口技术

“情感软件人”模型研究

软件人群的自律分散组织模型与协

多Agent 协商行为的效用分析

应用CBR技术对热风炉送风温度的

计算机动画角色的高级行为控制

一种改进的Hausdorff距离目标跟

改进型复杂过程全局进化算法在热连轧负荷分配中的应用

热轧机有限元与神经网络集成建模

一种构造行为动画系统主体的新方法

随机非线性系统自由状态方程的任意阶近似解

非线性受控系统状态方程的任意阶近似解

仿射非线性系统状态方程的任意阶近似解

软件人情感控制广义模型

Interaction model of artificial fish in virtual environment

计算机动画环境中基于认知的行为路径选择研究

基于认知的人工动物行为记忆研究

人工鱼“情+智”协调的“意图产生”与“行为控制”

构件化无缝主动迁移机制中的资源调度策略

自然风景图像情感标识方法研究

基于一种改进PSO的移动机器人路径规划

非线性系统中自调整模糊神经网络控制方法的应用研究

一种基于粒子群参数优化的改进蚁群算法

基于改进伪中值滤波器的道路图像滤波算法

基于非线性函数的移动机器人模糊避障算法

一种引入通信的多移动机器人编队方法

新的室内移动机器人的实时定位和运动规划方法

任务导向的仿人机器人体系结构设计

基于XML结构相似性的名老中医病例聚类分析

基于融合自适应形态滤波的分水岭分割新算法

中厚钢板MES的研究与设计

一类线性不确定切换系统的鲁棒镇定

群体中Agent基于内部状态的行为选择

基于RBF网络的机械人鲁棒自适应控制与仿真分析

基于动态人工势场法的路径规划仿真研究

一种新的永磁同步电机直接转矩控制方法

基于KAUTZ模型的预测控制仿真研究

差分型复杂过程全局进化方法

基于模糊粒度计算的文本聚类研究

一类状态时滞系统的最优预见控制器设计

不确定广义系统的保性能控制：LMI方法

一种减少永磁同步电机转矩脉动方法

自适应遗传算法在移动机器人路径规划中的应用

基于改进广义预测算法的精轧宽度控制方法

时滞随机系统的时滞相关稳定性

线性时滞不确定系统的时滞相关鲁棒镇定

基于粒子群算法的移动机器人全局路径规划策略

基于贝叶斯神经网络的带钢厚度预测与控制

一种基于遗传算法参数优化的改进人工势场法

一种基于粒子群参数优化的改进蚁群算法及其应用

A MULTI-AGENT LOCAL-LEARNING ALGORITHM UNDER GROUP ENVIROMENT

基于混沌粒子群——专用遗传算法切换策略的移动机器人路径规划

时滞系统的时滞相关鲁棒稳定与镇定问题

板宽板厚多变量系统的自抗扰解耦控制

Coupling Dynamic Model of Chatter for Cold Rolling

A Hierarchical Image Annotation Method Based on SVM and Semi-supervised EM

软件人群体智能自律协调模型研究及应用

Application of neural networks for permanent magnet synchronous motor direct torque control

多层高维关系元可拓集及其性质

基于人工生命的信息融合开发平台的研究

智能控制系统智能水平评价的软件系统

A new approach to obtain K-means initial clustering center based on fuzzy granular computing

智能系统智能特性的定性评价

A Kind of Context-aware Computing Approach for Proactive Service

电子束六维随机非线性状态方程及其任意阶近似解析解

期刊信息

《信息与控制》
北大核心期刊（2011版）

主管单位:中国科学院
主办单位:中国自动化学会中国科学院沈阳自动化研究所
主编：王天然
地址：沈阳市南塔街114号
邮编：110016
邮箱：xk@sia.cn
电话：024-23970049

国际标准刊号：ISSN：1002-0411
国内统一刊号：ISSN：21-1138/TP
邮发代号:

获奖情况:
全国优秀期刊三等奖,中科院优秀期刊三等奖,辽宁省优秀期刊一等奖

国内外数据库收录:
美国数学评论（网络版）,荷兰文摘与引文数据库,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,中国北大核心期刊（2000版）

被引量:12960