欢迎您!
东篱公司
退出
申报数据库
申报指南
立项数据库
成果数据库
期刊论文
会议论文
著 作
专 利
项目获奖数据库
位置:
成果数据库
>
期刊
> 期刊详情页
A Parallel Scheduling Algorithm for Reinforcement Learning in Large State Space
期刊名称:Frontier of Computer Science
时间:2012
页码:80-92
相关项目:面向tableau模型的逻辑强化学习理论及方法研究
作者:
刘全|
同期刊论文项目
面向tableau模型的逻辑强化学习理论及方法研究
期刊论文 41
专利 2
同项目期刊论文
局部时空域模型的核密度估计目标检测方法
A Scalable Parallel Reinforcement Learning Method Based on Divide-and-Conquer Strategy
一种最大集合期望损失的多目标Sarsa(λ)算法
遗传反馈的多特征图像检索
基于角点特征的几何同步数字水印算法
分布式数据库中基于局部CON模型的记录匹配方法
一种二阶TD Error快速Q(λ)算法
A sarsa algorithm based on double-layer fuzzy reasoning
Research of qos rounting algorithm in Ad Hoc networks based on reinforcement learning
基于多Agent并行采样和学习经验复用的E~3算法
一种基于资格迹的并行强化学习算法
一种基于智能调度的可扩展并行强化学习方法
一种改进的平均奖赏强化学习方法在RoboCup训练中的应用
一种动态挥发率和启发式修正的蚁群优化算法
一种基于启发式奖赏函数的分层强化学习方法
一种三角形网格空洞修复算法
一种高斯过程的带参近似策略迭代算法
基于tableau结点封闭值的非一致性数据库开放分支修复方法
双精英协同进化遗传算法
一种优先级扫描的Dyna结构优化算法
基于自适应势函数塑造奖赏机制的梯度下降Sarsa(λ)算法
利用移动内点来修复传感器网络空洞的算法
一种基于负补偿自由能量方程的聚类算法
基于优先级扫描Dyna结构的贝叶斯Q学习方法
基于两层模糊划分的时间差分算法
基于时间窗的自适应核密度估计运动检测方法
连续空间的递归最小二乘行动者—评论家算法
非清晰区域抑制下的显著对象检测方法
基于自适应归一化RBF网络的Q-V值函数协同逼近模型
基于相变和似然性的多相图像分割方法
一种基于线性函数逼近的离策略Q(λ)算法
A parallel scheduling algorithm for reinforcement learning in large state space
Image categorization using a semantic hierarchy model with sparse set of salient regions