东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：成果数据库 > 期刊 > 期刊详情页

半Markov决策过程折扣模型与平均

期刊名称：控制理论与应用, 23(1): 65-68. 2006年2月（EI）.
时间：0
相关项目：大规模不确定性半Markov系统基于性能势的鲁棒控制和神经元

作者：殷保群*, 李衍杰, 唐昊, 代桂平,

同期刊论文项目

大规模不确定性半Markov系统基于性能势的鲁棒控制和神经元

期刊论文 27 会议论文 7

同项目期刊论文

Optimization of a class of con

Robust control policy for clos

Error bounds of the optimizati

The optimal robust control pol

Performance potential-based Ne

Rollout及其并行求解算法在多类

平均和折扣准则MDP基于TD(0)学习

SMDP基于Actor网络的统一NDP方法

不确定SMDP基于全局优化的鲁棒决

半Markov决策过程的数值迭代优化

SMDP基于性能势的M步向前策略迭

基于策略迭代和遗传算法的SMDP鲁

多链MDP的鲁棒控制求解

基于负载分析与遗传算法的工业以

随机平稳策略下半Markov决策过程

一种自适应粒子群优化算法及其仿

网络速率控制的博弈模型

半Markov可信工业控制以太网研究

入侵攻击的防火墙无关性研究

搬运系统作业分配问题的小脑模型关节控制器Q学习算法

一种MDP基于性能势的并行Q学习算法

Rollout及其并行求解算法在多类商品库存控制中的应用

一种自适应粒子群优化算法及其仿真研究

多链MDP的鲁棒控制策略求解

基于负载分析与遗传算法的工业以太网控制系统设计

基于博弈和利润分享的中小科技企业出口代理研究