欢迎您!
东篱公司
退出
申报数据库
申报指南
立项数据库
成果数据库
期刊论文
会议论文
著 作
专 利
项目获奖数据库
位置:
成果数据库
>
会议
> 会议详情页
S(():一个基于平均奖赏MDPs的激励学习算法
所属机构名称:长沙理工大学
会议名称:中国智能自动化会议
作者或编辑:3448
第一作者单位:长沙理工大学
语言:中文
成果类型:会议
相关项目:智能体在部分可观测马尔可夫环境下的激励学习研究
作者:
陈焕文|谢丽娟|谢建平|
同会议论文项目
智能体在部分可观测马尔可夫环境下的激励学习研究
期刊论文 21
会议论文 9
同项目会议论文
一类激励学习问题的马尔可夫决策过程描述与求解方法
智能体激励学习问题及马尔科夫决策过程的作用
智能体的内部状态表达
Utility Clustering for reinforcement learning with partial observability
层次化与记忆结合的激励学习
TD方法与BP神经网络结合构造预测学习系统的算法分析与实现
Reinforcement learning with forgetting for solving POMDPs
在策略激励学习算法的POMDPs实验研究