随着视频处理规模的急剧增长,依赖于小规模专家标注数据集的传统视频检索方法已不能满足大规模数据环境,迫切需要寻求尽可能减少或避免专家人工干预、利用样本相对多样化的大规模视频数据集、并且能够同时处理大量视频概念的新方法。针对上述需求,本项目提出了一种基于概念拓扑结构的大规模协作式标签视频检索方法;通过对协作式标签信息进行优化,并基于统一化的概念相似度度量建立概念网络,最终基于概念拓扑结构来联合式地训练多个概念分类器。该方法完全避免了传统方法所依赖的专家人工干预过程,能够自动地获得成千上万的具有较强泛化能力的概念分类器,从而将为新的多媒体应用提供一个很好的基础性平台。
Video Retrieval;Large-scale;Collaborative Label;Concept Detection;Concept Network
针对依赖于小规模专家标注数据训练集的传统视频检索方法已不能满足当今大数据环境的迫切需求,本项目主要研究一种基于概念拓扑结构的大规模协作式标签视频检索方法;核心思想是通过对协作式标签信息进行优化,并基于统一化的概念相似度度量建立概念语义网络,最终基于概念拓扑结构来联合式地训练多个概念分类器。项目执行基本按照进度顺利进行,分别从大规模协作式标签视频数据概念分类的效率提升、如何综合文本信息和视觉信息建立跨模态的相似度度量、以及如何利用跨模态信息尽可能消除文本标签的噪声、如何基于概念网络进行概念检测学习任务等角度展开深入研究。主要研究成果包括在国外期刊上发表学术论文8篇(SCI收录3篇,EI收录4篇)、合作申请专利2项等;另有在审论文2篇。项目执行期间,独立培养了硕士研究生9人,并同时协助培养博士生3人。并带领3名本科生参加2014年全国英特尔嵌入式电子设计竞赛,并获得国家级三等奖。2013年期间,先后协助课题组邀请了芬兰Oulu大学的Abdenour Hardid教授、英国伯明翰大学Andrew Schofield博士来我校进行了短期学术访问和交流。2014年期间,拟参加ACM Multimedia国际会议1次(因签证问题没能成行),访问了德国康斯坦茨大学的D.A.Keim教授和荷兰阿姆斯特丹大学的Marcel Worring教授,初步拟定了合作主题和核心研究内容。