虽然目前Web上的图像资源急速膨胀,但对Web图像检索的研究还处在相当不成熟的阶段。本课题的研究目标是提出一种新颖的Web图像语义表示方法,并在此基础上研究更加有效的Web图像聚类和排序算法。具体研究1)根据Web多媒体网页内容,建立Web图像的文本和视觉特征的标注、类别和类型标注和发表时间等元数据描述,并把实体和突发词作为重要的标注词源。根据上述描述,利用领域本体和图算法对语义描述进行进一步的精化;2)研究新型的Web图像表示下的图像平面和层次聚类算法,以及通过聚类进行面向主题的图像聚类和对事件与热点的发现算法;3)研究根据Web多媒体网页自身的特点和分类信息,利用基于内容的图像检索中的反馈技术,结合用户查询日志,研究更有效的Web图像检索排序算法。上述研究问题是Web图像搜索引擎设计中最迫切需要解决的关键问题,并有着广泛的市场前景。
image annotation;information retrieval;search ranking;event discovery;machine learning
如何有效地从Web海量图像中检索到用户感兴趣的图像是下一代搜索引擎设计中必需考虑的关键问题之一。其中主要的科学研究问题包括对Web图像建立语义描述、发现合理的检索排序算法和基于共享图像的事件发现模型。本课题主要针对上述三个问题开展了研究。具体围绕着Web图像的语义自动标注方法、基于多维空间描述的新型图像检索排序算法和利用对Web图像及相关文本的聚类分析和摘要方法发现突发事件展开了研究。所取得的主要学术成果可归结为一、给出了若干关于Web图像自动标注的新颖算法、基于机器学习的对用户已有标注的改善算法、以及面向用户自行标注的图像标注词推荐算法;二、给出针对Web图像的视觉特征、相关文本特征和时间特征等多维语义空间描述下方法,以及基于这种描述的图像检索排序算法;分别提出了利用遗传、克隆和免疫等生物学计算的学习排序算法。根据提出的图像多特征语义描述方法,给出了把检索结果的相关性和多样性作为综合优化目标的Web图像搜索排序算法和对商业搜索引擎的检索结果的再排序算法。三、利用前述的理论成果,加上对图像的聚类分析、文本摘要技术和事件生命周期理论,给出了适合社会媒体上基于共享图像资源的突发事件发现方法。在上述理论研究的基础上,实现了多个原型系统,为未来Web 图像的检索和事件发现给出了若干实现技术。在本课题的研究中,已发表论文为 53 篇,其中,被SCI索引论文 6 篇、EI 索引论文 38 篇和ISTP 论文2篇。国际期刊论文18篇和国内核心期刊13篇。在ACM SIGIR,CIKM,MM,ICMR和WI国际会议上发表论文 15篇。培养出9名博士和12名硕士生。