视频目标跟踪拥有巨大的市场和广泛的应用前景。但是真实的场景非常复杂,可能包含如遮挡、光照变化、旋转、背景噪声、图像模糊、摄像机运动等诸多挑战。当前大多数跟踪方法还不能完全有效地解决这些困难。如何有效地抵制由这些困难所带来的影响是当前的研究难点和热点。本项目计划以鲁棒统计理论为基础,采用多线索融合和迁移学习理论的思路来研究和开发移动摄像机下的目标跟踪方法首先,研究设计鲁棒统计模型和算法,据此建立有效的目标形状模型;设计合理的假设权重函数,引入熵阈值法和交互信息理论,开发鲁棒的目标检测算法;建立有效的外观模型,研究基于概率统计和马尔科夫随机场的视频分割算法;最后,引入迁移学习理论,设计有效的核函数,提出遮挡处理策略和特征描述方法,采用多线索融合的方式,把鲁棒统计、目标检测、视频分割、迁移学习、多线索融合等集成在一个有效的目标跟踪系统中。本研究对视频监控、人机交互等领域有较高的学术与应用价值。
Video tracking;Robust model fitting;Object detection;Multi-cue fusion;Object appearance model
本项目主要围绕视频目标跟踪以及鲁棒统计模型中的基本问题开展研究,完成了项目研究任务,取得了预期的研究成果。在视频目标跟踪方面,主要针对目标跟踪中的目标表观模型、目标分割、多信息融合等关键技术进行研究,建立了基于三维离散余玄变换等多个目标表观模型;研究了集成背景减除和启发式种子选择机制的目标分割和抠图方法;开发了融合多跟踪器的目标跟踪方法;同时,研究了迁移学习理论,提出了基于Dempster-Shafer证据信息融合理论的目标跟踪方法。在鲁棒统计模型研究方面,针对多结构数据的拟合问题,提出了基于熵阈值法和交互信息理论的鲁棒模型拟合方法等多个鲁棒方法,并开发出一个精确鲁棒的基于内窥镜的颅骨内鼻腔手术导航系统,精确地跟踪内窥镜在颅内的位置并估计内窥镜的姿态,取得了亚毫米级别的精确度。此外,研究利用偏最小二乘法构造目标码本,生成了鲁棒的目标形状模型,并提出了基于加权稀疏最小二乘方法的目标检测方法。本项目发表学术论文40篇(SCI收录15篇,EI收录24篇),其中在国际顶级期刊IEEE TPAMI上发表论文3篇,另有3项国家发明专利获授权。本项目取得的研究成果为克服当前目标跟踪方法的局限性,提高其稳定性和鲁棒性奠定相关的理论技术基础,具有重要的理论与应用价值。