图像语义的自动分析与标注是非结构化多媒体数据管理的基础与关键问题。随着Web社会媒体(Web Social Media)的蓬勃发展,海量多媒体数据管理的需求愈加迫切,图像语义的自动分析与学习得到了各界的高度关注。本项目在深刻分析、理解图像语义的自动学习问题的基础上,以统计学习理论为工具,着力解决图像语义自动分析中的语义上下文建模等关键问题。创新性地把图像语义上下文建模作为图像语义标注研究的主线,对基于最大化Margin的条件随机场(Conditional Random Field)语义上下文建模理论与方法;图像语义上下文建模中的多核学习;基于语义上下文约束的图像相似性度量学习以及Web共享图像的语义分析与排序技术开展研究。通过对上述问题的研究,力争在图像、Web社会共享图像的自动语义分析与学习方面获得突破,取得一批创新研究成果。
image annotaiton;semantic context modeling;complex query video retrieval;Web coummunity question answer;
图像语义的自动分析与标注是非结构化多媒体数据管理的基础与关键问题。相关的语义分析与标注技术的研究具有重要的理论和应用价值。本项目围绕图像语义的自动标注问题,在基于语义上下文建模的图像标注技术,多特征学习的视频分类以及复杂视频查询等方面开展研究,取得了一批高质量的研究成果。同时基于上下文建模和稀疏正则化技术对Web社区问答摘要及问题分类技术进行研究,获得了重要进展。课题组发表论文13篇,其中多数为高质量的权威国际会议和国际期刊,包括ACM conference on Multimedia,ECCV,ACL,CIKM, IEEE TMM, Information Science等。获教育部2012年度自然科学二等奖一项, 获上海市优秀毕业研究生论文一篇。