欢迎您!
东篱公司
退出
申报数据库
申报指南
立项数据库
成果数据库
期刊论文
会议论文
著 作
专 利
项目获奖数据库
位置:
成果数据库
>
期刊
> 期刊详情页
最小状态变元平均奖赏的强化学习方法
期刊名称:通信学报, 2011, 32(1): 66-71
时间:0
相关项目:基于tableau的非经典逻辑经典化的自动定理证明研究
同期刊论文项目
基于tableau的非经典逻辑经典化的自动定理证明研究
期刊论文 39
会议论文 13
同项目期刊论文
A Bit-decomposition Adaptive Watermarking Algorithm Based on the Multi-Polar Mask
Global and local convergence of a class of penalty-free-type methods for nonlinear programming
关系强化学习方法的初步研究
一种局部的重叠社区发现方法
一种基于粗糙集的社区结构发现算法
基于布尔矩阵的Deep Web复杂模式匹配
遗传反馈的多特征图像检索
基于角点特征的几何同步数字水印算法
一种动态挥发率和启发式修正的蚁群优化算法
基于强化学习的多策略选择遗传算法
基于角点特征的集合同步数字水印算法
一种基于启发式奖赏函数的分层强化学习方法
Relevance feedback techniques and genetic algorithm for image retrieval based on multiple features.
Double elite co-evolutionsry genetic algorithm
利用tableau方法修正Deep Web中不相容知识
Convergence of Affine-scaling Interior-point Methods with Line Search for Box Constrained Optimizati
一种大规模离散空间中的高斯强化学习方法
双精英协同进化遗传算法
基于时间窗的自适应核密度估计运动检测方法
非清晰区域抑制下的显著对象检测方法
基于相变和似然性的多相图像分割方法
一种基于线性函数逼近的离策略Q(λ)算法
一种多分类器Deep Web数据源的自动分类与判别方法
融合目标特征和空间信息的粒子滤波跟踪
基于总体变分修复模型的图像编码
基于分段多高斯和辐射模板的人脸检测
一阶逻辑公式自动推演前的预处理
一种用于二维流体表面绘制算法的研究
基于Bayes序贯估计的无线传感器网络数据融合算法
一种基于图的颜色纹理区域分割方法
快速3D-MSPIHT视频编码算法
聚类差分图像核密度估计前景目标检测
传感器网络病毒感染传播局域控制研究
不规则扁平粒状物表面平整度识别与分选方法的研究