东篱科研大数据发现系统（DRDS）

位置：成果数据库 > 期刊 > 期刊详情页

一种基于划分和集成思想的多智能体强化学习

期刊名称：南京师范大学学报(工程技术版)
时间：0
页码：59-62
语言：中文
分类：TP301[自动化与计算机技术—计算机系统结构;自动化与计算机技术—计算机科学与技术]
作者机构：[1]南京财经大学信息工程学院,江苏南京210046
相关基金：国家自然科学基金（70802025）资助项目.
相关项目：基于多智能体强化学习的电子市场动态定价研究

作者：王云|韩伟|

关键词：多智能体系统, 强化学习, 状态空间划分, multiagent system, reinforcement learning, state-space partition

中文摘要：

针对Q学习状态空间非常大,导致收敛速度非常慢的问题,利用智能体在不同样本上分类性能不同,提出了基于样本的学习误差对样本空间进行划分,充分发掘了样本和智能体的匹配关系.以带障碍物的格子世界作为仿真环境,表明该算法提高了在线学习性能.

英文摘要：

To counter for the problem of slowly convergence of Q leaning when comeing to large state-space, the paper puts forward an algorithm which divide the states space according to learning errors. The basic idea of our algorithm is to discover the matching relationship between agents and the sub-space of states space. The simulations in grids with blocks indicate that the algorithm performs better when comeing to on-line learning.

同期刊论文项目

基于多智能体强化学习的电子市场动态定价研究

期刊论文 10 会议论文 2

同项目期刊论文

对称协调博弈问题的多智能体强化学习

效用驱动的Markov强化学习

基于进化算法的多智能体合作学习

基于模糊推理的多智能体强化学习

电子市场排污权交易的多智能体协商方法

虚拟企业资源结盟博弈的启发式遗传算法

基于边界样本协调的多智能体合作学习

带贯通约束的不规则排样分阶构造算法

长记忆过程的参数估计及其在金融市场中的应用