位置:成果数据库 > 期刊 > 期刊详情页
平均奖赏MDPs的在策略无模型激励学习算法
  • 期刊名称:计算机工程与科学
  • 时间:0
  • 作者或编辑:3448
  • 第一作者所属机构:长沙理工大学
  • 页码:23(2).66-69,2001年4月
  • 语言:中文
  • 相关项目:智能体在部分可观测马尔可夫环境下的激励学习研究
同期刊论文项目
同项目期刊论文