视觉目标跟踪技术是视觉行为分析、人机交互,以及视频语义理解的基础,已成为计算机视觉、机器人等领域具有挑战性的热点研究问题。而稀疏表达是基于冗余字典的一种信号表示方法,对噪声干扰有很好的鲁棒性,在很多领域都获得了成功应用。本项目针对视觉目标跟踪,开展基于稀疏表达的目标跟踪方法研究,建立视觉目标的有效稀疏表达,将其与粒子滤波结合以构造视觉目标跟踪算法;为适应跟踪过程中目标和环境的变化,引入半监督学习机制对冗余字典进行在线更新;解决稀疏分解的在线高效求解问题;将相关算法推广至多目标视觉跟踪应用;最后,利用视觉跟踪实验系统对提出的方法进行综合测试和评价。本项目的研究工作不仅可推动视觉目标跟踪与压缩感知的学术进展,而且可以为许多实际的应用领域,如视频监控、机器人人机交互、军事侦察等提供高性能的视觉目标跟踪方案,在国民经济和国防建设两方面均具有重要的实际意义和广阔的应用前景。
Visual object tracking;sparse coding;multi-cue fusion;experimental validation;
视觉目标跟踪是计算机视觉、机器人等领域的重要关键问题。在实际场景中受目标外观变化、背景干扰等的影响,需要开发鲁棒的目标描述方法。本项目利用稀疏编码的思想,在粒子滤波框架下建立了统一的目标跟踪方法。除解决单目标、单特征跟踪问题外,还考虑了多目标、多特征融合问题。以往针对多特征融合的方法大都需要利用复杂的联合稀疏优化方法,本项目从目标外观特性入手,利用空间约束关系建立鲁棒的局部约束编码方法。该方法可以非常自然地推广到多特征融合,而无需复杂的联合稀疏编码优化。此外,我们将目标跟踪方法用于机器人的实时目标跟踪,取得了满意的效果。 通过本项目的研究,我们系统地建立了目标跟踪的稀疏编码方法,并在此基础上开展了目标检测、目标识别和视频内容理解等方面的研究工作。这些工作不仅对于视频内容分析等领域的理论研究工作具有明显的推动作用,而且可以为许多实际系统,如视频监控、视觉侦察、机器人环境建模等提供高性能的解决方案,在国民经济建设方面具有重要的实际意义。