欢迎您!
东篱公司
退出
申报数据库
申报指南
立项数据库
成果数据库
期刊论文
会议论文
著 作
专 利
项目获奖数据库
位置:
成果数据库
>
会议
> 会议详情页
基于高斯回归的连续空间多智能体最佳响应策略学习
所属机构名称:中南大学
会议名称:Proceeding of the 31st Chinese Control Conference
时间:2012.7.7
成果类型:会议
相关项目:基于合作策略自学习的多机器人系统智能协作模型
作者:
魏海军|陈鑫|吴敏|曹卫华|
同会议论文项目
基于合作策略自学习的多机器人系统智能协作模型
期刊论文 16
会议论文 6
获奖 4
专利 3
同项目会议论文
Timesharing-Tracking: a new framework for Decentralized Reinforcement Learning in Cooperative Multi-
An efficient reinforcement learning algorithm for continuous actions
Optimal tracking agent: A new framework for multi-agent reinforcement learning
Multi-agent Q-learning with joint state value approximation
Cooperative Learning with Indirect Interactions