东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：成果数据库 > 期刊 > 期刊详情页

A Parallel Scheduling Algorithm for Reinforcement Learning in Large State Space

期刊名称：Frontier of Computer Science
时间：2012
页码：80-92
相关项目：面向tableau模型的逻辑强化学习理论及方法研究

作者：刘全|

同期刊论文项目

面向tableau模型的逻辑强化学习理论及方法研究

期刊论文 41 专利 2

同项目期刊论文

局部时空域模型的核密度估计目标检测方法

A Scalable Parallel Reinforcement Learning Method Based on Divide-and-Conquer Strategy

一种最大集合期望损失的多目标Sarsa(λ)算法

遗传反馈的多特征图像检索

基于角点特征的几何同步数字水印算法

分布式数据库中基于局部CON模型的记录匹配方法

一种二阶TD Error快速Q(λ)算法

A sarsa algorithm based on double-layer fuzzy reasoning

Research of qos rounting algorithm in Ad Hoc networks based on reinforcement learning

基于多Agent并行采样和学习经验复用的E~3算法

一种基于资格迹的并行强化学习算法

一种基于智能调度的可扩展并行强化学习方法

一种改进的平均奖赏强化学习方法在RoboCup训练中的应用

一种动态挥发率和启发式修正的蚁群优化算法

一种基于启发式奖赏函数的分层强化学习方法

一种三角形网格空洞修复算法

一种高斯过程的带参近似策略迭代算法

基于tableau结点封闭值的非一致性数据库开放分支修复方法

双精英协同进化遗传算法

一种优先级扫描的Dyna结构优化算法

基于自适应势函数塑造奖赏机制的梯度下降Sarsa（λ）算法

利用移动内点来修复传感器网络空洞的算法

一种基于负补偿自由能量方程的聚类算法

基于优先级扫描Dyna结构的贝叶斯Q学习方法

基于两层模糊划分的时间差分算法

基于时间窗的自适应核密度估计运动检测方法

连续空间的递归最小二乘行动者—评论家算法

非清晰区域抑制下的显著对象检测方法

基于自适应归一化RBF网络的Q-V值函数协同逼近模型

基于相变和似然性的多相图像分割方法

一种基于线性函数逼近的离策略Q（λ）算法

A parallel scheduling algorithm for reinforcement learning in large state space

Image categorization using a semantic hierarchy model with sparse set of salient regions