视频中运动目标的跟踪与识别是计算机视觉研究领域的根本问题和终极目标之一,在民用、商用乃至军用领域都有着广阔的应用前景。国内外这方面的工作目前仍主要集中于把跟踪和识别当作两个独立的任务来研究,尽管两者实际上是相辅相成的关系。一方面,识别目标类别能为跟踪提供自顶向下的先验,另一方面,准确地定位目标,识别才能有的放矢。本项目拟研究一种基于图模型理论的统一框架,把目标跟踪与目标识别有机地结合起来。图模型框架能以图的方式来简洁地描述这个复杂系统中各变量之间的相关关系,并以概率的方式来描述系统的不确定性以及约束系统的一致性,并利用图论与人工智能领域的相关算法对未知变量进行统计推理。我们目前在这个研究方向上的初步研究成果包括利用图模型结合背景建模和目标分割在视频分析方面的应用。我们认为此项研究无论是对于计算机视觉理论的推进和有效解决实际应用问题都有很大的意义。
object localization;object recognition;graphical model;;
目标的定位与识别是计算机视觉研究领域的根本问题和终极目标之一,在民用、商用乃至军用领域都有着广阔的应用前景。传统方法通常把定位和识别当作两个独立的任务来研究,尽管两者实际上是相辅相成的关系。一方面,正确地识别目标类别能为目标定位提供自顶向下的先验知识;另一方面,准确地定位目标能使目标识别过程更加有的放矢。本研究项目尝试利用基于图模型理论的新技术把目标定位与目标识别结合到一个统一的框架下。我们在相关很多领域进行了研究工作,包括特征表示,聚类和分类,目标定位(如检测,分割,跟踪),目标识别,目标定位与识别,深度学习等,并且在这些领域开发了很多新的算法。我们获得了很多有意义和前景的结果,不仅发表在各种期刊和会议上,而且得到了实际的应用。