基于视频序列的内容分析和理解在网络视频搜索和智能视频监控等新兴领域具有非常重要的意义。作为对不确定系统建模的一种有力工具,概率图模型被公认为最主流的框架。但由于视频数据呈现出随机性、非线性、快速性和大数据量的特点,使得概率图模型多数基本问题(如推理、学习等等)为指数级规模或NP难问题,在实际应用中处理起来具有很高的复杂度。因此本项目的研究目标是获得适用于视频数据的普遍和高效的概率图模型算法。研究的中心思路是围绕目前国际上公认非常具有潜力的对偶优化理论,建立以对偶近似为核心的研究框架。在具体方法上采用本项目组提出的概率结构分解和凸化思想对图模型基本问题进行快速算法求解。研究的结果最终在实际视频序列所对应的复杂图模型上进行验证。项目的成果不仅表现为视频数据分析算法的改进,更为重要的是可以进一步推进概率图模型对偶理论的进步,促进非确定性智能数据处理领域的发展。
Graphical Models;Dual Decomposition;Probabilistic Inference;Structure Learning;Objective tracking
概率图模型是对不确定性系统建模和求解的有力工具,在计算机视频、人工智能、机器学习和信号处理等领域有着广泛应用,本项目主要研究概率图用于视频序列分析等问题时遇到的新问题及求解的新方法。但由于视频数据的随机性、非线性、快速性和大数据量等特点,使得概率图模型多数基本问题(如推理、学习等等)为指数级规模或NP 难问题,在实际应用中处理起来具有很高的复杂度。因此本项目的研究目标是获得适用于视频数据的普遍和高效的概率图模型算法,研究的中心思路是围绕目前国际上公认非常具有潜力的对偶优化理论,建立以对偶近似为核心的研究框架。该项目在概率图模型的概率推理、结构学习及在视频序列中的应用等问题上取得了阶段性研究成果。在概率推理方面,构建了概率图模型MAP推理问题的统一框架,并提出新的变分推理算法;在结构学习方面,提出了概率图模型中二元和多元情况下的变量定向,以及面向解释任务和面向预测任务的变量选择算法;在视频序列的应用方面,利用概率图模型对视频序列的结构化表示,构建了基于马尔可夫随机场的多摄像机跟踪框架,并解决了跟踪问题中的外观变化、遮挡和模板漂移等问题。该项目目前发表或录用SCI期刊论文10篇,EI期刊论文3篇,顶级国际会议AAAI论文1篇。项目的成果不仅表现为视频数据分析算法的改进,更为重要的是可以进一步推进概率图模型对偶理论的进步,促进非确定性智能数据处理领域的发展。