东篱科研大数据发现系统（DRDS）

位置：成果数据库 > 期刊 > 期刊详情页

基于模糊推理的多智能体强化学习

期刊名称：计算机应用与软件 (Computer Applications and Software)
时间：0
页码：96-99
语言：中文
分类：TP301.4[自动化与计算机技术—计算机系统结构;自动化与计算机技术—计算机科学与技术]
作者机构：[1]南京财经大学信息工程学院,江苏南京210046
相关基金：2011中国计算机大会论文.国家自然科学基金项目（70802025）.
相关项目：基于多智能体强化学习的电子市场动态定价研究

作者：韩伟|

关键词：强化学习(RL), 多智能体系统(MAS), 模糊推理, 电子市场, Reinforcement learning （RL） Multi-agent system （MAS） Fuzzy inference Electronic market

中文摘要：

以电子市场智能定价问题为研究背景，提出基于模糊推理的多智能体强化学习算法（FI—MARL）。在马尔科夫博弈学习框架下，将领域知识初始化为一个模糊规则集合，智能体基于模糊规则选择动作，并采用强化学习来强化模糊规则。该方法有效融合应用背景的领域知识，充分利用样本信息并降低学习空间维数，从而增强在线学习性能。在电子市场定价的对比实验中，智能体无论在合作还是在竞争的问题上都表现出较为长远的智能行为，提高了平均定价收益。

英文摘要：

Under the background of pricing in electronic markets, a multi-agent reinforcement learning algorithm based on fuzzy inference is proposed. Within Markov stochastic game framework, domain knowledge is initialized into fuzzy rules. Agents choose their actions according to those rules, which are updated by reinforcement learning. By doing so, Domain knowledge is effectively integrated; each domain sample is effectively exploited; more importantly, the learning dimension is greatly reduced. Compassion with former pricing algorithm indicates that FI-MARL improves average pricing profits, both individually and collectively; agents acquire long-term intelligence around either the cooperation or the competition issue.

同期刊论文项目

基于多智能体强化学习的电子市场动态定价研究

期刊论文 10 会议论文 2

同项目期刊论文

对称协调博弈问题的多智能体强化学习

一种基于划分和集成思想的多智能体强化学习

效用驱动的Markov强化学习

基于进化算法的多智能体合作学习

电子市场排污权交易的多智能体协商方法

虚拟企业资源结盟博弈的启发式遗传算法

基于边界样本协调的多智能体合作学习

带贯通约束的不规则排样分阶构造算法

长记忆过程的参数估计及其在金融市场中的应用