东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：成果数据库 > 期刊 > 期刊详情页

样本有限关联值递归Q学习算法及其收敛性证明

期刊名称：计算机研究与发展
时间：0
作者或编辑：3448
第一作者所属机构：长沙理工大学
页码：39(9).1064-1070，2002年9月
语言：中文
相关项目：智能体在部分可观测马尔可夫环境下的激励学习研究

作者：殷苌茗|陈焕文|谢丽娟|

同期刊论文项目

智能体在部分可观测马尔可夫环境下的激励学习研究

期刊论文 21 会议论文 9

同项目期刊论文

激励学习的广义平均算法及其收敛性

基于有限样本的最优费用关联值递归Q学习算法

基于每阶段平均费用最优的激励学习算法

一类基于有效跟踪的广义平均奖赏激励学习算法

部分可观测Markov 环境下的激励学习综述

折扣与无折扣MDPs：一个基于SARSA(()算法的实例分析

平均奖赏MDPs的在策略无模型激励学习算法

一类值函数激励学习的遗忘算法

一个因素化SARSA(()激励学习算法

激励学习的最优判据研究

基于Ｑ-学习的非线性控制

Solution to reinforcement learning problems with artificial potential field

基于RL算法的自学习博弈程序设计及实现

基于Snake模型的虹膜定位算法

乳头丘脑束损伤对大鼠内源性注意的影响

基于PSO和共轭梯度法的MIP路由优化方案

“比较治疗学”的原理与方法浅析

癫痫预测方法的分析与研究

“比较治疗学”与“循证医学”之比较

脑电图分析的方法论