基于贝叶斯推理的模糊逻辑强化学习模型研究-东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：立项数据库 > 立项详情页

基于贝叶斯推理的模糊逻辑强化学习模型研究

项目名称：基于贝叶斯推理的模糊逻辑强化学习模型研究
项目类别：面上项目
批准号：61272005
项目来源：国家自然科学基金
研究期限：1900-01-01-1900-01-01

项目负责人：刘全
依托单位：苏州大学
批准年度：2012

成果综合统计

成果类型

数量

期刊论文
会议论文
专利
获奖
著作

31
0
0
0
0

期刊论文

一种最大集合期望损失的多目标Sarsa(λ)算法

一种二阶TD Error快速Q(λ)算法

一种三角形网格空洞修复算法

一种高斯过程的带参近似策略迭代算法

一种优先级扫描的Dyna结构优化算法

基于自适应势函数塑造奖赏机制的梯度下降Sarsa（λ）算法

利用移动内点来修复传感器网络空洞的算法

基于优先级扫描Dyna结构的贝叶斯Q学习方法

基于两层模糊划分的时间差分算法

基于自适应归一化RBF网络的Q-V值函数协同逼近模型

基于主曲线的遥感图像河岸线提取

一种基于独立任务的POMDP问题的解决方法

一种基于高斯过程的行动者评论家算法

基于多层卷积神经网络特征和双向长短时记忆单元的行为识别

增量式双自然策略梯度的行动者评论家算法

基于可中断Option的在线分层强化学习方法

一种用于连续动作空间的最小二乘行动者-评论家方法

一种基于视觉注意力机制的深度循环Q网络模型

基于多注意力卷积神经网络的特定目标情感分析

一种不稳定环境下的策略搜索及迁移方法

A parallel scheduling algorithm for reinforcement learning in large state space

基于栈式降噪自动编码器的气体识别

支持合并的自适应tile coding算法

基于变步长迭代算法的微轴承参量特性研究

一种基于NAND闪存高效的页面替换算法

高校数据库技术实验设计与在线实验系统整合研究

刘全的项目

基于模糊逻辑的大规模强化学习理论及方法

期刊论文 10

　DeepWeb中不完备知识处理的理论及方法研究

基于tableau的非经典逻辑经典化的自动定理证明研究

期刊论文 39 会议论文 13

面向tableau模型的逻辑强化学习理论及方法研究

期刊论文 41 专利 2

基于部分感知模型的贝叶斯强化学习理论及方法

　DeepWeb中不完备知识处理的理论及方法研究

近红外波段堆垛结构三维光子晶体的制备和研究

期刊论文 2 会议论文 6 获奖 2 专利 5