多智能体系统是复杂系统的一种典型形式,其特征为个体间通过耦合产生相互作用和影响,系统整体的行为同时取决于个体的内部结构和个体间相互作用的影响,因此个体行为与整体行为之间的关系就成为一个基本的科学问题。复杂控制系统的子系统间不仅存在耦合,还常具有耦合作用未知、信息交换拓扑受限、信息传输失真、信道容量受限等多种不确定性因素,加上子系统内部本身还可有各种不确定性,因此难以通过侧重于单系统控制器设计的传统控制理论来进行分析与综合。本项目在已有工作研究框架基础上,通过对智能体引入反馈学习机制,使其充分利用所能获取的局部信息,从理论与仿真及应用角度探讨自主多智能体能否以分散方式实现系统整体的控制目标(稳定性、性能指标、跟踪、编队等),回答反馈学习机制在复杂系统中能起到的作用或根本局限等基本科学问题。本类问题源于郭雷院士开创的反馈机制能力极限研究,而定位于加深对复杂系统控制基本问题的理解。
Uncertainties;Adaptive estimation/control;Feedback learning;Multi-agent systems;Coupling uncertainties
本项目按照申请报告的研究计划,主要理论成果如下对有未知参数的离散时间一维及高维线性系统,提出并分析全新而基本的一步及多步猜测自适应估计及控制,进而应用于多智能体系统以对付未知的耦合参数;对具有多种不确定性的三角结构非线性系统,提出并分析输出反馈预测自适应控制,进而应用于具有隐式领航者的多智能体系统实现协同跟踪;对状态未知的不确定线性系统,提出并分析全新的序贯自适应卡尔曼滤波、有限模型自适应滤波及相应控制,进而应用于多智能体系统,提出并分析多种多智能体分散滤波;对同时有参数及非参数不确定性的多智能体系统,提出并分析多智能体分散半参数自适应控制算法;提出并分析基于自适应切换的多种新型粒子群优化;提出新型的机器人最优编队。对定位跟踪、导航制导、编队围捕、人机交互等多智能体控制的实际背景,在建模分析的基础上,根据系统结构及问题特点,利用反馈信息进行自适应估计与控制,提出基于自适应切换群优化的定位跟踪技术、基于目标轨迹预测及策略估计的自适应导弹制导算法、基于有限模型自适应滤波的陀螺降噪、基于序贯自适应卡尔曼滤波的初始对准、基于群优化算法的机器人最优编队、基于自适应学习机制的人机智能交互等技术。出版专著章节2部;发表论文近30篇,其中SCI 已检索5篇,EI 已检索20余篇;申请发明专利4项。这些理论及应用成果从多个角度、针对多种多智能体系统的背景探讨了反馈学习机制所起到的作用与极限,表明自适应学习机制能够在一定条件下有效地对付系统中的各种不确定性,包括智能体间的耦合不确定性。项目负责人获得霍英东青年教师奖1项,项目成员获得北京市青年英才项目1项。