欢迎您!
东篱公司
退出
申报数据库
申报指南
立项数据库
成果数据库
期刊论文
会议论文
著 作
专 利
项目获奖数据库
位置:
成果数据库
>
期刊
> 期刊详情页
样本有限关联值递归Q学习算法及其收敛性证明
期刊名称:计算机研究与发展
时间:0
作者或编辑:3448
第一作者所属机构:长沙理工大学
页码:39(9).1064-1070,2002年9月
语言:中文
相关项目:智能体在部分可观测马尔可夫环境下的激励学习研究
作者:
殷苌茗|陈焕文|谢丽娟|
同期刊论文项目
智能体在部分可观测马尔可夫环境下的激励学习研究
期刊论文 21
会议论文 9
同项目期刊论文
激励学习的广义平均算法及其收敛性
基于有限样本的最优费用关联值递归Q学习算法
基于每阶段平均费用最优的激励学习算法
一类基于有效跟踪的广义平均奖赏激励学习算法
部分可观测Markov 环境下的激励学习综述
折扣与无折扣MDPs:一个基于SARSA(()算法的实例分析
平均奖赏MDPs的在策略无模型激励学习算法
一类值函数激励学习的遗忘算法
一个因素化SARSA(()激励学习算法
激励学习的最优判据研究
基于Q-学习的非线性控制
Solution to reinforcement learning problems with artificial potential field
基于RL算法的自学习博弈程序设计及实现
基于Snake模型的虹膜定位算法
乳头丘脑束损伤对大鼠内源性注意的影响
基于PSO和共轭梯度法的MIP路由优化方案
“比较治疗学”的原理与方法浅析
癫痫预测方法的分析与研究
“比较治疗学”与“循证医学”之比较
脑电图分析的方法论