图像分类是计算机视觉和模式识别等领域的最基本科学问题之一,广泛应用于与军事和国民经济及社会生活密切相关的各种信息检索系统中。在大规模网络图像分类与检索的应用中,传统分类器学习存在由于专业标注的训练样本集小,从而导致分类器泛化能力不强的问题,本项目针对这一问题,探索一种以大规模弱标注图像代替专业标注训练样本集的泛化能力强的分类器学习新方法。具体内容包括1)研究大规模弱标注图像集中感兴趣标注与相应图像提取方法;2)研究基于标注不确定性处理的有意义图像主题和训练样本集筛选方法;3)研究图像的视觉相似性和语义相似性的描述及结合方式,建立准确的图像主题网络;4)研究基于主题网络的可伸缩分类器的学习方法;5)算法性能评价。项目研究取得的突破将对信息学科及相关学科的发展产生较大影响,同时利用互联网信息进行学习的新思路也为其它相似应用中的分类器学习提供参考。
Large-scale weak label images;image classification;label uncertainty;image topic network;generalization
针对传统分类器学习存在的由于专业标注的训练样本集小从而导致分类器泛化能力不强的问题,本项目探索以大规模弱标注图像代替专业标注训练样本集的泛化能力强的分类器学习新方法,研究重点是解决标注不确定性处理等关键问题,主要研究内容包括1)大规模弱标注图像集中感兴趣标注与相应图像提取方法;2)基于标注不确定性处理的有意义图像主题和训练样本集筛选方法;3)图像的视觉相似性和语义相似性的描述及结合方式,建立准确的图像主题网络;4)基于主题网络的可伸缩分类器的学习方法;5)算法性能评价。项目主要成果及学术贡献体现在以下几个方面 1)在标注提取方面,提出了一系列图像标签优化方法,如基于辅助文本的图像自动标注方法、基于多层聚类的图像垃圾标签净化方法、基于语义本体、正则化以及多示例学习的图像标签优化方法、基于随机游走的图像和社会标签对齐方法等,这些方法有效地减少了弱标注图像存在的标注不确定性对训练集有效性的影响;2)在训练图像提取方面,提出了基于搜索引擎和聚类的交互式垃圾图像过滤方法,有效地减少了弱标注图像的不确定性对训练集有效性的影响;3)在基于主题网络的分类器学习方面,提出了在视觉特征空间利用概念内视觉均匀性和概念间差异性无缝结合的语义鸿沟定量描述方法,为具有不同语义鸿沟概念的学习提供理论指导;提出了基于潜在语义分析以及弱标注图像的多示例学习算法,有效地提高了分类器性能。4)在基于主题网络的图像摘要方面,提出了基于AP聚类和稀疏表示的图像摘要选取方法,为基于主题网络的图像检索打下了基础。结合相关研究已发表标注有基金号的学术论文38篇(SCI收录13篇、A类会议2篇),其中在《IEEE Transactions on Multimedia》等国际刊物上发表论文13篇,在CVPR等国际会议上发表论文12篇,其他核心期刊上发表论文13篇。2013年获得陕西省科学技术(基础研究类)二等奖。参加国际学术会议12篇次。培养博士生2名、硕士生2名。图像分类是涉及计算机视觉、模式识别、机器学习和图像处理等多个领域重要和基本的科学问题之一,本项目所提出的利用大规模互联网信息进行分类器学习的新方法为从根本上促进图像分类器泛化能力提供一条新途径,该思路也可以推广应用于其它类型数据如大规模文本数据、语音数据等的分类、识别。