动力学对策问题是一类典型的、非常普遍的问题(如导航定位、制导、机器人足球赛等),其特点是局中人行为可由动力学方程表示,系统通过局中人之间的动力学关系和行为决策来不断演化。传统对策论(博弈论)的理论假设与研究方法并不适于用一般动力学对策问题,主要体现在其研究对象基本不考虑动力学;其"完全理性人"的理论假设不符合很多动力学对策问题的实际情形;其基于有限策略偶的理论框架难以处理多数动力学对策问题中无限取值的状态或指标;其研究思路主要偏重于讨论各种平衡点(鞍点、Nash均衡等)的存在性,难于对对策过程给出有效指导。基于这些考虑,本项目将在团队成员已有的工作基础上,融合多学科交叉的背景,针对导航、制导与控制领域一些典型动力学对策问题,发展一系列的学习与预测算法,对这些算法进行基础理论研究,并进一步发掘其在实际问题中的应用潜力。课题涉及对策论、优化理论、信号处理、控制论、信息融合等领域的理论与思想。
dynamical games;navigation;guidance;learning and prediction;adaptive control
具有动力学的动态对策问题(如导航定位、制导、机器人足球赛等)广泛存在,其特点是局中人行为可由动力学方程表示,系统通过局中人之间的动力学关系和行为决策来不断演化。项目组以导航、制导与控制领域的动力学对策问题为研究对象,进一步探索、发展动力学对策问题中的学习与预测算法。 经过三年的研究工作,项目组取得了丰硕的研究成果,部分成果已应用于陆用导航系统中,先后获国家科技进步二等奖1项,北京市科学技术奖二等奖1项;发表论文40余篇,SCI/EI收录20余篇;出版专著/教材2部,章节2章。其中《传递对准理论与应用》是国内该领域唯一专著,《Kalman滤波理论及其在导航系统中的应用》自出版至今累计他引900余次,SCI他引24次,被北京航空航天大学等几所国内重点大学选作研究生教材。在人才培养方面,在该项目的支持下,项目组成员有2人入选教育部新世纪优秀人才支持计划,2人晋升教授,1人晋升为副教授;培养博士生2人,硕士生16人。 在项目支持下,(1)在非对称型动力学对策问题的学习与预测算法方面,我们针对只利用或只可利用一步历史数据的情形,提出了一步猜测自适应学习预测与控制的框架,针对原始OSG算法及其多种变种,分析了闭环稳定性。(2)在多模型卡尔曼滤波算法方面,基于“速度+角速度”匹配对准模式提出了主-从自适应滤波器,降低对载体机动运动方式和机动强度的限制;提出了一种里程计辅助惯性导航系统的行进间对准中的多模态滤波融合算法,实现了陆用惯性导航系统的全自主行进间对准;提出了一种GPS辅助惯性导航系统行进间对准方法,提高了系统的滤波收敛速度和对准精度;基于有限模型自适应控制思想,提出一种有限模型滤波算法,并基于极小化矢量距离给出了模型的选取原则,降低了滤波算法对模型精确性的要求。(3)在基于新息约束校正的估计与预测算法方面,提出一种以里程计输出信号为外信息约束的卡尔曼滤波算法,解决了陆用惯性导航行进间初始对准问题;针对不同导航传感器采样时刻不对准问题,提出了一种信息同步技术,解决了多导航传感器采样时刻不对准问题,已成功用于陆用惯性/多信息组合导航系统。(4)在基于学习和预测的自适应导弹导引律的研究方面,提出一种基于轨迹学习、策略学习和预报的新型离散时间制导律,可有效对付具有机动性的运动目标。