图像分类是模式识别、数据挖掘、计算机视觉等学科领域的基本问题,是图像检索、目标识别等应用的关键技术。主动学习是机器学习中的一类重要学习方法。本项目旨在研究如何利用主动学习方法解决现有大规模图像分类方法存在的若干难点问题,特别是大量未标注样本的有效利用问题和分类过程中的人机交互机制。通过分析大规模图像分类中存在的特征提取与表示、分类器学习、人工标注与采样等几个关键问题,结合主动学习方法中的多视角学习、选择性采样等特点,研究出符合主动学习的特征表示方法、多视角分类器之间的协作学习和增强方法、快速高效的批量标注方法、以及对主动学习本身存在的理论问题进行完善和拓展。通过研究基于主动学习的图像分类问题不仅会有助于解决大规模图像分类中存在的关键科学问题,也会进一步促进数据挖掘、机器学习等相关领域的交叉研究,加快与图像分类问题相关的技术应用。
Active Learning;Image Classification;Feature Extraction;;
按项目计划书的规划,本项目通过分析大规模图像分类中存在的特征提取与表示、分类器学习、人工标注与采样等几个关键问题,结合主动学习方法中的多视角学习、选择性采样等方法,研究出符合主动学习的特征表示方法、多视角分类器之间的协作学习和增强方法、快速高效的批量标注方法、以及对主动学习本身存在的理论问题进行完善和拓展。在过去三年(2010年-2012年),在本自然科学基金项目的支持下,我们探索和研究了利用主动学习方法解决图像分类问题中存在的若干关键问题,重点研究了主动学习方法、特征表示与聚类方法、图像序列分类等几个方面的理论与方法,克服了一些难点问题,取得了较好的成果。预期研究目标是发表论文10-15篇,申请专利2-3项。到项目结题时,项目组成员共发表论文16篇,包括7篇国际杂志论文和9篇国际会议论文,其中有2篇论文发表在多媒体领域顶级杂志《IEEE Transactions on Multimedia》上。此外,还申请2项专利,其中1项已经获得授权。在项目的资助下,项目组成员积极开展国际学术交流,有5人次参加国际学术会议。总体来看,我们按照预定计划研究了各项主要研究内容,研究成果达到了预期指标,实现了预期目标。