东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：成果数据库 > 期刊 > 期刊详情页

连续时间POMDP的策略梯度估计

期刊名称：控制理论与应用录用, 2008
时间：0
相关项目：隐Markov过程的性能灵敏度分析与优化

同期刊论文项目

隐Markov过程的性能灵敏度分析与优化

期刊论文 20

同项目期刊论文

Sensitivity analysis and estimates of the performance for M/G/1 queueing systems

Performance optimization of semi-Markov decision processes with discounted-cost criteria

A state aggregation approach to singularly perturbed Markov reward processes

基于观测的POMDP优化算法及其仿真

基于POMDP模型的机器人行动的仿真优化

动态电源管理超时策略自适应优化算法

Partially observable Markov decision processes and performance sensitivity analysis

Error bounds of optimization algorithms for semi-Markov decision processes

一类分层非结构化P2P系统的随机切换模型

基于POMDP的VOD接入控制建模与仿真

动态电源管理的随机切换模型与策略优化

半Markov控制过程基于性能势仿真的并行优化算法

基于性能势的Markov控制过程双时间尺度仿真算法

动态电源管理超时策略与随机型策略的等效关系

非线性采样观测器的误差分析

基于耦合技术计算Markov链性能势的仿真算法

基于双层P2P架构的VoD系统

基于CDN和P2P的分布式网络存储系统

无线多媒体通信网适应带宽配置在线优化算法