基于内容的视频检索是国际上在信息检索领域最前沿的研究方向之一。视频事件检测是对视频进行语义标注和分析最有效的手段。由于视频数据的复杂性以及不确定性,我们拟采用适用于不确定数据分析的软计算方法以及基于人类大脑神经科学的感知模型作为研究基础,开展视频事件检测算法研究。1.研究适合于视频、音频数据分析的软计算方法,并将其应用于视频镜头边界检测、音频分类当中。2.研究基于视觉、听觉感知模型以及生物感知原理的关键帧提取、特殊音效检测以及人脸目标检测方法。3. 根据提取到的音视频关键线索,将软计算方法与人脑感知认知理论相结合,构建适合于多种类型视频的事件检测模型。该项目的研究成果将为在视频中寻找感兴趣的事件提供有效工具,为多媒体检索技术的发展提供新的技术途径。另一方面,对于该项目的研究,促进了软计算方法以及人类大脑感知理论的发展。同时,也为计算机视觉、神经科学以及视频检索等领域搭建了一个桥梁。
video retrival;Perception Model;Soft computation;Event detection;
视频事件检测是对视频进行语义标注和分析最有效的手段并且在视频监控等领域有很大的应用前景。本项目的研究工作围绕五个主要方向展开(1)基于软计算方法的镜头边界检测算法;(2)基于机器学习的音频分类与特殊音效检测;(3)视觉感知注意力模型的研究;(4)基于神经生物学感知模型的视频目标检测算法;(5)基于感知模型和软计算的视频事件检测算法。在理论创新方面,提出了一系列的新方法、新理论,在国际、国内主流学术期刊和会议上发表学术论文15 篇,其中SCI 检索7 篇、EI 检索8 篇。在关键技术方面取得了一系列成果,其中已获得授权发明专利2项,受理发明专利2 项;获得陕西省科学技术二等奖和三等奖各1 项,陕西高等学校科学技术一等奖1 项,中国计算机学会多值逻辑语模糊逻辑专业委员会优秀论文2项;在国内外交流方面,组织CIVR2010 国际会议等学术活动,研究成果受到国内外专家好评。在项目可持续发展方面,课题组已经在图像质量评估,以及静态极光图像分类与极光卵分割等方向开拓出新的研究领域,为进一步更深入的研究奠定了基础。同时,也为计算机视觉、神经科学以及视频检索等领域搭建了一个桥梁。