本课题旨在探讨基于视觉、听觉等多模态特征,结合体育视频编辑的特点和体育运动的规则,利用统计学习的方法,来自动检测和标注体育视频中的语义事件。研究工作主要包括设计一个可扩展的事件检测框架、底层视觉和听觉特征的鲁棒抽取、镜头的有效分类、以及事件的推理方案,并以足球视频为背景建立一个基于事件的体育视频分析原型系统。项目的研究成果可用于基于内容的体育视频检索、辅助教练分析,同时对于低带宽网络环境下的视频传输和现场播报等,也有着非常重要的应用价值。
本课题旨在探讨基于视觉、听觉等多模态特征,结合体育视频编辑的特点和体育运动的规则,利用统计学习的方法,来自动检测和标注体育视频中的语义事件。研究工作主要包括设计一个可扩展的事件检测框架、低层视觉和听觉特征的鲁棒抽取、镜头的有效分类、以及事件的推理方案,并以足球视频为背景建立一个基于事件的体育视频分析原型系统。项目的研究成果可用于基于内容的体育视频检索、辅助教练分析,同时对于低带宽网络环境下的视频传输和现场播报等,也有着非常重要的应用价值。