本项目主要研究如下三方面。1.一般状态的连续时间马氏决策过程的最优性条件和算法2受约束连续时间马氏决策过程及其参数的摄动理论;3最优解的特征和实际模型的应用问题。本项目中的研究内容是马氏决策过程中的前沿和核心问题。因而本项目的研究对推动马氏决策过程的理论和计算的进一步发展,拓展并加深其应用领域具有十分重要的意义。
本项目在连续时间马氏过程最优控制问题中的折扣和平均最优策略的存在条件和计算方法、以及实际应用等方面的研究中取得系列重要进展。在国内外学术期刊上共发表论述论文45 篇,其中SCI论文20 篇,且发表主要结果的杂志Ann. Appl. Probab.,SIAM J. Contro & Optima.和IEEE Trans. Automat. Control分别为概率论,应用数学和控制论领域的国际顶级杂志. 具体地说对状态转移率可能无界的情形,基于非齐次Q-过程的构造和最小非负解理论,提出了使非齐次Q-过程唯一并诚实的新条件。 据此创造性提出了相当合理的关于折扣和平均模型最优策略存在的系列强有利的新条件和新方法,给出了相应的策略迭代算法,最优平稳策略的逼近算法,解决了著名学者提出的相关问题。另外,还首次发现了最优平稳策略与现代随机分析中鞅之间的等价关系,并首次研究了受约束的折扣模型和平均模型,证明了约束最优策略的存在性,并进一步刻画出约束最优策略的结构。还对排队系统、一般化的Potlach 过程,人口过程等实际模型的最优控制问题进行了分析,得到了许多满意的结果.