位置:成果数据库 > 期刊 > 期刊详情页
平均和折扣准则MDP基于TD(0)学习
  • 期刊名称:控制理论与应用, 23(2):292-296,2006年4月(EI).
  • 时间:0
  • 相关项目:大规模不确定性半Markov系统基于性能势的鲁棒控制和神经元
同期刊论文项目
同项目期刊论文