对象分割是智能多媒体处理领域中的重要研究内容,而如何提取对象语义信息则是影响分割成功的关键因素。本项目针对目前语义对象分割的研究现状,提出了基于感知视觉单词描述的语义对象检测与分割新方法。由于利用了人的感知特性,并把该信息嵌入于视觉单词描述中,因此该方法比一般的对象提取方法具有更好的语义特征。主要研究内容包括分析不同视觉特征的感知水平,建立特征感知度等概念的形式化描述,构建符合感知特性的视觉单词。针对视觉单词存在的不确定性问题,建立具有内在关联特性的视感知单词及词典新方法。并在此基础上,利用空域或空时域相关特性,构建潜在感知主题学习模型。最后通过建立合理的数据和平滑似然函数,提出能量优化准则,建立单词到像素的细化分割方法,从而实现感知对象的检测与分割。这一研究有望为解决语义对象的理解分析提供新的思路和理论依据。
object segmentation;perception;visual word;topic model;saliency
对象分割是智能多媒体处理领域中的重要研究内容。本项目针对目前语义对象分割的研究现状,提出了基于感知视觉单词描述的语义对象检测与分割新方法。主要研究内容包括分析不同视觉特征的感知水平,建立特征感知度等概念的形式化描述,构建符合感知特性的视觉单词。针对视觉单词存在的不确定性问题,建立具有内在关联特性的视感知单词及词典新方法。并在此基础上,利用空域或空时域相关特性,构建潜在感知主题学习模型。最后通过建立合理的数据和平滑似然函数,提出能量优化准则,建立单词到像素的细化分割方法,从而实现感知对象的检测与分割。这一研究为解决语义对象的理解分析提供新的思路和理论依据,尤其对视觉信息中关键对象的获取和分析具有重要的理论意义和应用价值。该理论成果可广泛应用在基于内容的图像和视频处理,比如对象分析与理解、事件分析与编辑、视频摘要、图像/视频检索和浏览、以及有效的感知区域编码等等。通过对课题的深入研究,取得了一系列处于领先地位的学术成果,先后在国内外一些著名刊物和会议上发表 33篇高水平学术论文。其中SCI 期刊论文16 篇, EI论文33篇,IEEE期刊论文12篇,其中8篇发表在本领域著名国际期刊IEEE Trans. Image Processing,IEEE Trans. Multimedia,IEEE Trans. Circuits and Systems for Video Technology, IEEE Trans. Broadcasting上。已授权国家发明专利1项,申请国家发明专利11项。在该基金资助基础上成功申请举办了自然基金国际合作项目“2010 年IEEE 国际智能信号处理与通信系统会议”,并且担任大会联席主席。在人才培养方面,培养博士生3名,已毕业1名,硕士生8名,已毕业4名。