随着Internet技术的发展,互联网上的图像数量飞速增长。针对如何利用丰富的网络图像资源实现基于语义的图像检索和管理,本课题致力于研究基于网络知识和轻量人工知识的图像语义模型学习关键技术。本课题拟从网络知识的获取出发,首先利用图像搜索自动搜集网络图像作为语义模型的训练数据,解决传统语义模型学习中训练数据不足的问题;然后针对网络知识噪声大的特点,提出网络知识的质量评估概念,用于定量分析网络知识的可靠性,同时研究基于多样化重排序和多源知识融合的网络知识的质量改进方案;在网络知识质量差时引入轻量人工知识进行辅助,针对人工标注代价高的特点,提出高效的主动样本选择方案,用尽量少的人工标注量获取最多的信息;最后探讨如何充分利用网络知识和人工知识各自特点的图像特征表达和机器学习问题,全面分析图像语义模型学习中的关键问题。本课题将有力推动图像语义理解和网络知识挖掘的基础理论和技术研究。
英文主题词image retrieval;image annotation;image search quality assessment;visual reranking;machine Learning