欢迎您!
东篱公司
退出
申报数据库
申报指南
立项数据库
成果数据库
期刊论文
会议论文
著 作
专 利
项目获奖数据库
位置:
成果数据库
>
期刊
> 期刊详情页
连续时间POMDP的策略梯度估计
期刊名称:控制理论与应用录用, 2008
时间:0
相关项目:隐Markov过程的性能灵敏度分析与优化
同期刊论文项目
隐Markov过程的性能灵敏度分析与优化
期刊论文 20
同项目期刊论文
Sensitivity analysis and estimates of the performance for M/G/1 queueing systems
Performance optimization of semi-Markov decision processes with discounted-cost criteria
A state aggregation approach to singularly perturbed Markov reward processes
基于观测的POMDP优化算法及其仿真
基于POMDP模型的机器人行动的仿真优化
动态电源管理超时策略自适应优化算法
Partially observable Markov decision processes and performance sensitivity analysis
Error bounds of optimization algorithms for semi-Markov decision processes
一类分层非结构化P2P系统的随机切换模型
基于POMDP的VOD接入控制建模与仿真
动态电源管理的随机切换模型与策略优化
半Markov控制过程基于性能势仿真的并行优化算法
基于性能势的Markov控制过程双时间尺度仿真算法
动态电源管理超时策略与随机型策略的等效关系
非线性采样观测器的误差分析
基于耦合技术计算Markov链性能势的仿真算法
基于双层P2P架构的VoD系统
基于CDN和P2P的分布式网络存储系统
无线多媒体通信网适应带宽配置在线优化算法