位置:成果数据库 > 期刊 > 期刊详情页
非负费用折扣半马氏决策过程
  • ISSN号:0583-1431
  • 期刊名称:《数学学报》
  • 时间:0
  • 分类:O211.62[理学—概率论与数理统计;理学—数学] O231.3[理学—运筹学与控制论;理学—数学]
  • 作者机构:[1]中山大学数学与计算科学学院,广州510275
  • 相关基金:国家自然科学基金资助项目(60874004 10925107)
中文摘要:

本文考虑可数状态非负费用的折扣半马氏决策过程.首先在给定半马氏决策核和策略下构造一个连续时间半马氏决策过程,然后用最小非负解方法证明值函数满足最优方程和存在ε-最优平稳策略,并进一步给出最优策略的存在性条件及其一些性质.最后,给出了值迭代算法和一个数值算例.

英文摘要:

This paper deals with discounted semi-Markov decision processes with countable states and nonnegative costs.We first construct a continuous-time semi-Markov decision process under a given semi-Markov decision kernel and each policy. Then,we prove that the value function satisfies the optimality equation and there exists an e-optimal stationary policy by using a minimum nonnegative solution approach,and further give conditions for the existence of optimal policies as well as some properties of optimal policies.Finally,a value iteration algorithm for computing the value function is developed and a numerical example is given.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《数学学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学院
  • 主办单位:中国科学院数学与系统科学研究院数学研究院
  • 主编:李炳仁
  • 地址:北京市海淀区中关村东路55号
  • 邮编:100080
  • 邮箱:Actamath@amss.ac.cn
  • 电话:010-62551910
  • 国际标准刊号:ISSN:0583-1431
  • 国内统一刊号:ISSN:11-2038/O1
  • 邮发代号:2-502
  • 获奖情况:
  • 1996年中科院优秀科技期刊二等奖,1997年全国优秀科技期刊二等奖,2000年中科院优秀科技期刊二等奖
  • 国内外数据库收录:
  • 美国数学评论(网络版),德国数学文摘,荷兰文摘与引文数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:9981