欢迎您!
东篱公司
退出
申报数据库
申报指南
立项数据库
成果数据库
期刊论文
会议论文
著 作
专 利
项目获奖数据库
位置:
成果数据库
>
期刊
> 期刊详情页
半Markov决策过程折扣模型与平均
期刊名称:控制理论与应用, 23(1): 65-68. 2006年2月(EI).
时间:0
相关项目:大规模不确定性半Markov系统基于性能势的鲁棒控制和神经元
作者:
殷保群*, 李衍杰, 唐昊, 代桂平,
同期刊论文项目
大规模不确定性半Markov系统基于性能势的鲁棒控制和神经元
期刊论文 27
会议论文 7
同项目期刊论文
Optimization of a class of con
Robust control policy for clos
Error bounds of the optimizati
The optimal robust control pol
Performance potential-based Ne
Rollout及其并行求解算法在多类
平均和折扣准则MDP基于TD(0)学习
SMDP基于Actor网络的统一NDP方法
不确定SMDP基于全局优化的鲁棒决
半Markov决策过程的数值迭代优化
SMDP基于性能势的M步向前策略迭
基于策略迭代和遗传算法的SMDP鲁
多链MDP的鲁棒控制求解
基于负载分析与遗传算法的工业以
随机平稳策略下半Markov决策过程
一种自适应粒子群优化算法及其仿
网络速率控制的博弈模型
半Markov可信工业控制以太网研究
入侵攻击的防火墙无关性研究
搬运系统作业分配问题的小脑模型关节控制器Q学习算法
一种MDP基于性能势的并行Q学习算法
Rollout及其并行求解算法在多类商品库存控制中的应用
一种自适应粒子群优化算法及其仿真研究
多链MDP的鲁棒控制策略求解
基于负载分析与遗传算法的工业以太网控制系统设计
基于博弈和利润分享的中小科技企业出口代理研究