会议详情页-东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：成果数据库 > 会议 > 会议详情页

S(()：一个基于平均奖赏MDPs的激励学习算法

所属机构名称：长沙理工大学
会议名称：中国智能自动化会议
作者或编辑：3448
第一作者单位：长沙理工大学
语言：中文
成果类型：会议
相关项目：智能体在部分可观测马尔可夫环境下的激励学习研究

作者：陈焕文|谢丽娟|谢建平|

同会议论文项目

智能体在部分可观测马尔可夫环境下的激励学习研究

期刊论文 21 会议论文 9

同项目会议论文

一类激励学习问题的马尔可夫决策过程描述与求解方法

智能体激励学习问题及马尔科夫决策过程的作用

智能体的内部状态表达

Utility Clustering for reinforcement learning with partial observability

层次化与记忆结合的激励学习

TD方法与BP神经网络结合构造预测学习系统的算法分析与实现

Reinforcement learning with forgetting for solving POMDPs

在策略激励学习算法的POMDPs实验研究