位置:立项数据库 > 立项详情页
基于自适应动态规划的非线性系统零和微分对策
  • 项目名称:基于自适应动态规划的非线性系统零和微分对策
  • 项目类别:青年科学基金项目
  • 批准号:60904037
  • 申请代码:F030113
  • 项目来源:国家自然科学基金
  • 研究期限:2010-01-01-2012-12-31
  • 项目负责人:魏庆来
  • 负责人职称:副研究员
  • 依托单位:中国科学院自动化研究所
  • 批准年度:2009
中文摘要:

本项目将研究基于自适应动态规划的非线性系统零和微分对策问题。拟解决目前对非线性系统零和微分对策鞍点判定以及微分对策鞍点与混合最优解的求解难题,建立以自适应动态规划为基础的一套新的理论分析体系和求解方案,开辟求解非线性系统零和微分对策的新途径。主要研究内容包括1.研究基于自适应动态规划理论求解鞍点存在的非线性系统二人零和微分对策问题;2.研究非线性系统二人零和微分对策问题鞍点不存在时基于自适应动态规划的混合最优控制方法;3.研究基于自适应动态规划的非线性系统多人零和微分对策问题;4.避开鞍点存在性的复杂判据,建立一种统一有效的自适应动态规划方法使得当对策的鞍点存在时控制策略可以使得性能指标函数达到鞍点而在鞍点不存在时达到对策的混合最优解。上述研究成果将为非线性系统和零和微分对策理论的发展提供新的思路,丰富最优控制理论和微分对策理论的研究内容,同时推动智能系统理论和我国自动化技术的深入发展。

结论摘要:

自适应动态规划(ADP)是利用神经网络来逼近动态规划的性能指标函数,实现最优控制的策略,有效地解决了动态规划维数灾的难题,为高维复杂系统的最优控制提供了一种切实可行的理论和方法,近年来其理论和方法的研究日益受到重视。项目以自适应动态规划理论为研究主线,以非线性系统零和微分对策为重点展开相关领域的一系列研究工作,所获得的研究成果包括1. 研究基于自适应动态规划理论求解非线性系统二人零和微分对策问题;2. 研究基于自适应动态规划的非线性系统多人零和微分对策问题;3. 避开鞍点存在性的复杂判据,建立一种统一有效的自适应动态规划方法使得当对策的鞍点存在时控制策略可以使得性能指标函数达到鞍点而在鞍点不存在时达到对策的混合最优解;同时分别建立了二人零和微分对策与多人零和微分对策的性能指标函数收敛性分析与非线性系统系统稳定性分析体系,为自适应动态规划在零和微分对策中得以实现奠定坚实的理论基础;4. 将带有系统噪声的非线性系统最优控制有效地转换成零和对策问题,采用迭代自适应动态规划方法解决了非线性系统H∞鲁棒最优控制问题,获得最优控制器;5. 建立有限域迭代自适应动态规划理论,使得迭代性能指标函数在有限时间内达到最优性能指标函数的ε-临域之内,同时证明了系统的稳定性以及性能指标函数的ε-最优性;6. 在自适应动态规划实现过程中,采用全局二次启发式规划技术,构建三种神经网络分别近似代价函数及其偏导数、控制律和被控对象。此算法既可以保证较高的计算精度,又能刻画出代价函数序列的收敛过程;7. 由于性能指标函数的高非线性需要采用神经网络等近似结构近似性能指标函数,因此近似误差必然存在。基于自适应动态规划原理,提出了带有误差的自适应动态规划迭代算法,并提出了新型基于“误差上界”的收敛性判别方法。获得了自适应动态规划迭代过程中的容许误差的上界,给出迭代收敛条件;8. 时滞是控制系统普遍存在的现象之一。基于自适应动态规划原理,建立双迭代自适应动态规划的方法,采用性能指标函数与迭代控制律同时进行迭代获得了时滞系统的最优控制,同时证明了性能指标函数的收敛性与最优性。9. 将自适应动态规划的理论研究成果应用于智能电网、变换炉等实际系统中,获得较好的控制效果。在基金支持下,课题研究成果已发表论文35篇,SCI源期刊论文12篇、受理发明专利2项、获软件著作权登记2项等。


成果综合统计
成果类型
数量
  • 期刊论文
  • 会议论文
  • 专利
  • 获奖
  • 著作
  • 15
  • 21
  • 2
  • 0
  • 0
会议论文
相关项目
期刊论文 54 会议论文 25 获奖 5 专利 1
期刊论文 90 会议论文 50 著作 3
魏庆来的项目