针对复杂监控视频,尤其是采用可移动PTZ摄像机情况下,本项目研究一种通用的全局轨迹解析框架和高效推理计算方法。本项目的研究思路是构建通用概率表达模型,使得物体外观信息、语义信息、运动信息以及场景上下文互为约束和参照,并在贝叶斯框架下采样推理,搜寻最优解。我们首先在一个观察片段(如20帧)内定义一个时空图表达结构,全局轨迹解析问题就转换为时空图的划分与匹配问题;基于贝叶斯理论,我们进一步将这个时空图划分与匹配问题定义为一个后验概率的最大化问题,其中运动目标抽取,场景上下文关联关系,物体类型概率等信息作为先验概率模型,通过运动目标的运动和外观一致性构造似然概率模型。针对此概率模型,我们提出一种高效的随机聚类采样算法进行全局搜索,在时间和空间两个维度迭代计算最优解。本项目的成果可以作为核心智能模块应用于日益重要的智能视频监控系统中,同时也是一些相关研究的重要基础。
Intelligent Surveillance;Video Analysis;Object Tracking;Trajectory Parsing;
针对复杂监控视频,尤其是采用可移动PTZ摄像机情况下,本项目研究一种通用的全局轨迹解析框架和高效推理计算方法。本项目的研究思路是构建通用概率表达模型,使得物体外观信息、语义信息、运动信息以及场景上下文互为约束和参照,并在贝叶斯框架下采样推理,搜寻最优解。我们首先在一个观察片段(如20帧)内定义一个时空图表达结构,全局轨迹解析问题就转换为时空图的划分与匹配问题;基于贝叶斯理论,我们进一步将这个时空图划分与匹配问题定义为一个后验概率的最大化问题,其中运动目标抽取,场景上下文关联关系,物体类型概率等信息作为先验概率模型,通过运动目标的运动和外观一致性构造似然概率模型。针对此概率模型,我们提出一种高效的随机聚类采样算法进行全局搜索,在时间和空间两个维度迭代计算最优解。本项目的成果可以作为核心智能模块应用于日益重要的智能视频监控系统中,同时也是一些相关研究的重要基础。