东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：成果数据库 > 期刊 > 期刊详情页

一种改进的平均奖赏强化学习方法在RoboCup训练中的应用

ISSN号：1000-2073
期刊名称：苏州大学学报(自然科学版)
时间：2012.4.4
页码：21-26
相关项目：面向tableau模型的逻辑强化学习理论及方法研究

作者：李瑾|刘全|杨旭东|杨凯|翁东良|

同期刊论文项目

面向tableau模型的逻辑强化学习理论及方法研究

期刊论文 41 专利 2

同项目期刊论文

局部时空域模型的核密度估计目标检测方法

A Scalable Parallel Reinforcement Learning Method Based on Divide-and-Conquer Strategy

一种最大集合期望损失的多目标Sarsa(λ)算法

遗传反馈的多特征图像检索

基于角点特征的几何同步数字水印算法

分布式数据库中基于局部CON模型的记录匹配方法

一种二阶TD Error快速Q(λ)算法

A sarsa algorithm based on double-layer fuzzy reasoning

Research of qos rounting algorithm in Ad Hoc networks based on reinforcement learning

基于多Agent并行采样和学习经验复用的E~3算法

A Parallel Scheduling Algorithm for Reinforcement Learning in Large State Space

一种基于资格迹的并行强化学习算法

一种基于智能调度的可扩展并行强化学习方法

一种动态挥发率和启发式修正的蚁群优化算法

一种基于启发式奖赏函数的分层强化学习方法

一种三角形网格空洞修复算法

一种高斯过程的带参近似策略迭代算法

基于tableau结点封闭值的非一致性数据库开放分支修复方法

双精英协同进化遗传算法

一种优先级扫描的Dyna结构优化算法

基于自适应势函数塑造奖赏机制的梯度下降Sarsa（λ）算法

利用移动内点来修复传感器网络空洞的算法

一种基于负补偿自由能量方程的聚类算法

基于优先级扫描Dyna结构的贝叶斯Q学习方法

基于两层模糊划分的时间差分算法

基于时间窗的自适应核密度估计运动检测方法

连续空间的递归最小二乘行动者—评论家算法

非清晰区域抑制下的显著对象检测方法

基于自适应归一化RBF网络的Q-V值函数协同逼近模型

基于相变和似然性的多相图像分割方法

一种基于线性函数逼近的离策略Q（λ）算法

A parallel scheduling algorithm for reinforcement learning in large state space

Image categorization using a semantic hierarchy model with sparse set of salient regions

期刊信息

《苏州大学学报：自然科学版》

主管单位:江苏省教育厅
主办单位:苏州大学
主编：郎建平
地址：江苏省苏州市十梓街1号
邮编：215006
邮箱：fangtong@suda.edu.cn
电话：0512-65225985 65225991传

国际标准刊号：ISSN：1000-2073
国内统一刊号：ISSN：32-1226/N
邮发代号:

获奖情况:

国内外数据库收录:
美国化学文摘（网络版）

被引量:2060