欢迎您!
东篱公司
退出
申报数据库
申报指南
立项数据库
成果数据库
期刊论文
会议论文
著 作
专 利
项目获奖数据库
位置:
立项数据库
> 立项详情页
基于贝叶斯推理的模糊逻辑强化学习模型研究
项目名称:基于贝叶斯推理的模糊逻辑强化学习模型研究
项目类别:面上项目
批准号:61272005
项目来源:国家自然科学基金
研究期限:1900-01-01-1900-01-01
项目负责人:刘全
依托单位:苏州大学
批准年度:2012
成果综合统计
成果类型
数量
期刊论文
会议论文
专利
获奖
著作
31
0
0
0
0
期刊论文
一种最大集合期望损失的多目标Sarsa(λ)算法
一种二阶TD Error快速Q(λ)算法
一种三角形网格空洞修复算法
一种高斯过程的带参近似策略迭代算法
一种优先级扫描的Dyna结构优化算法
基于自适应势函数塑造奖赏机制的梯度下降Sarsa(λ)算法
利用移动内点来修复传感器网络空洞的算法
基于优先级扫描Dyna结构的贝叶斯Q学习方法
基于两层模糊划分的时间差分算法
基于自适应归一化RBF网络的Q-V值函数协同逼近模型
基于主曲线的遥感图像河岸线提取
一种基于独立任务的POMDP问题的解决方法
一种基于高斯过程的行动者评论家算法
基于多层卷积神经网络特征和双向长短时记忆单元的行为识别
增量式双自然策略梯度的行动者评论家算法
基于可中断Option的在线分层强化学习方法
一种用于连续动作空间的最小二乘行动者-评论家方法
一种基于视觉注意力机制的深度循环Q网络模型
基于多注意力卷积神经网络的特定目标情感分析
一种不稳定环境下的策略搜索及迁移方法
A parallel scheduling algorithm for reinforcement learning in large state space
基于栈式降噪自动编码器的气体识别
支持合并的自适应tile coding算法
基于变步长迭代算法的微轴承参量特性研究
一种基于NAND闪存高效的页面替换算法
高校数据库技术实验设计与在线实验系统整合研究
刘全的项目
基于模糊逻辑的大规模强化学习理论及方法
期刊论文 10
DeepWeb中不完备知识处理的理论及方法研究
基于tableau的非经典逻辑经典化的自动定理证明研究
期刊论文 39
会议论文 13
面向tableau模型的逻辑强化学习理论及方法研究
期刊论文 41
专利 2
基于部分感知模型的贝叶斯强化学习理论及方法
DeepWeb中不完备知识处理的理论及方法研究
近红外波段堆垛结构三维光子晶体的制备和研究
期刊论文 2
会议论文 6
获奖 2
专利 5