欢迎您!
东篱公司
退出
申报数据库
申报指南
立项数据库
成果数据库
期刊论文
会议论文
著 作
专 利
项目获奖数据库
位置:
成果数据库
>
期刊
> 期刊详情页
一种改进的平均奖赏强化学习方法在RoboCup训练中的应用
ISSN号:1000-2073
期刊名称:苏州大学学报(自然科学版)
时间:2012.4.4
页码:21-26
相关项目:面向tableau模型的逻辑强化学习理论及方法研究
作者:
李瑾|刘全|杨旭东|杨凯|翁东良|
同期刊论文项目
面向tableau模型的逻辑强化学习理论及方法研究
期刊论文 41
专利 2
同项目期刊论文
局部时空域模型的核密度估计目标检测方法
A Scalable Parallel Reinforcement Learning Method Based on Divide-and-Conquer Strategy
一种最大集合期望损失的多目标Sarsa(λ)算法
遗传反馈的多特征图像检索
基于角点特征的几何同步数字水印算法
分布式数据库中基于局部CON模型的记录匹配方法
一种二阶TD Error快速Q(λ)算法
A sarsa algorithm based on double-layer fuzzy reasoning
Research of qos rounting algorithm in Ad Hoc networks based on reinforcement learning
基于多Agent并行采样和学习经验复用的E~3算法
A Parallel Scheduling Algorithm for Reinforcement Learning in Large State Space
一种基于资格迹的并行强化学习算法
一种基于智能调度的可扩展并行强化学习方法
一种动态挥发率和启发式修正的蚁群优化算法
一种基于启发式奖赏函数的分层强化学习方法
一种三角形网格空洞修复算法
一种高斯过程的带参近似策略迭代算法
基于tableau结点封闭值的非一致性数据库开放分支修复方法
双精英协同进化遗传算法
一种优先级扫描的Dyna结构优化算法
基于自适应势函数塑造奖赏机制的梯度下降Sarsa(λ)算法
利用移动内点来修复传感器网络空洞的算法
一种基于负补偿自由能量方程的聚类算法
基于优先级扫描Dyna结构的贝叶斯Q学习方法
基于两层模糊划分的时间差分算法
基于时间窗的自适应核密度估计运动检测方法
连续空间的递归最小二乘行动者—评论家算法
非清晰区域抑制下的显著对象检测方法
基于自适应归一化RBF网络的Q-V值函数协同逼近模型
基于相变和似然性的多相图像分割方法
一种基于线性函数逼近的离策略Q(λ)算法
A parallel scheduling algorithm for reinforcement learning in large state space
Image categorization using a semantic hierarchy model with sparse set of salient regions
期刊信息
《苏州大学学报:自然科学版》
主管单位:江苏省教育厅
主办单位:苏州大学
主编:郎建平
地址:江苏省苏州市十梓街1号
邮编:215006
邮箱:fangtong@suda.edu.cn
电话:0512-65225985 65225991传
国际标准刊号:ISSN:1000-2073
国内统一刊号:ISSN:32-1226/N
邮发代号:
获奖情况:
国内外数据库收录:
美国化学文摘(网络版)
被引量:2060