欢迎您!
东篱公司
退出
申报数据库
申报指南
立项数据库
成果数据库
期刊论文
会议论文
著 作
专 利
项目获奖数据库
位置:
立项数据库
> 立项详情页
基于支持向量机的增量式强化学习技术及其应用研究
项目名称:基于支持向量机的增量式强化学习技术及其应用研究
项目类别:面上项目
批准号:61373094
项目来源:国家自然科学基金
研究期限:1900-01-01-1900-01-01
项目负责人:伏玉琛
依托单位:苏州大学
批准年度:2013
成果综合统计
成果类型
数量
期刊论文
会议论文
专利
获奖
著作
11
0
0
0
0
期刊论文
连续空间的递归最小二乘行动者—评论家算法
一种基于独立任务的POMDP问题的解决方法
一种基于高斯过程的行动者评论家算法
连续空间中的随机技能发现算法
增量式双自然策略梯度的行动者评论家算法
基于可中断Option的在线分层强化学习方法
一种用于连续动作空间的最小二乘行动者-评论家方法
一种基于视觉注意力机制的深度循环Q网络模型
基于多注意力卷积神经网络的特定目标情感分析
一种不稳定环境下的策略搜索及迁移方法
一种基于示例轨迹的抽象动作树构造方法
伏玉琛的项目
基于逻辑强化学习的Deep Web模式匹配研究
期刊论文 27
会议论文 3
专利 1