感知和认识运动是生物视觉系统最基本功能之一,研究具有生物学基础的运动感知模型在计算机视觉研究中具有非常重要的地位。本研究以统计学习的Bayesian机(Bayesian分析+MCMC计算)为基础,结合概率图模型,建立视频中运动数据的非线性表示模型;在模型的学习和推理中引入模拟进化计算中的"优胜劣汰"的思想,设计高效的统计进化计算方法;并基于上述运动表示模型与计算方法研究视频分析中多目标跟踪、非线性动力学行为的分类与学习、分析与合成等三个主要问题。本研究从时间连续的观测数据-视频数据出发,通过统计学习方法分析运动的动力学特性,研究运动特征选择和绑定(Binding)问题,建立起数据的统计描述模型,然后利用此描述模型完成运动模式的分类、匹配以及自动产生合成逼近真实的、所期望的运动数据,这对于实现在高水平语义基础上的视频分析与合成、多媒体技术具有重要的理论和实际应用价值。
在基金项目的资助下,课题组紧紧围绕视频分析中的运动分析与合成问题开展工作。在基础理论研究方面,针对具有语义意义的多目标运动特征自动提取问题,重点研究了动态马尔可夫网络及贝叶斯网络等概率图模型及学习算法,提出了用于多目标跟踪的概率图模型及基于粒子集合的信任传播算法;针对像素级的运动分析问题提出了时域相关与内容联合自适应的运动补偿时域滤波器及运动矢量的可伸缩编码方法;在面向实际的应用系统构造方面,系统研究了目标鲁棒跟踪及多传感器目标融合跟踪技术,提出了多线索集成的目标表示模型、交互多运动模型的目标跟踪与交互式多跟踪器融合,实现了具有视觉线索、模型、跟踪器及传感器等四层融合结构的多光谱图像传感器融合跟踪系统,该系统已被列为某国防重大创新项目的关键技术之一。已有23篇论文在重要国际学术会议和国内外核心学术期刊发表;获得国家发明专利授权5项,国外发明专利2项,软件著作权2项;获得国家科学技术发明二等奖1项;项目负责人应邀在国际会议作特邀学术报告4次,扩大了与国际同行的交流。人才培养方面,项目负责人已入选教育部新世纪优秀人才支持计划,已毕业博士研究生1名,硕士研究生7名。