海量数据的存储与管理技术是当前信息产业发展中的重点研究内容,而面对海量数据的检索问题往往被业界所忽略。虽然当前基于文本方式的信息检索技术已十分成熟与完善,但对于类似图像之类的复杂多媒体数据而言,该检索技术存在一定缺陷,为此基于内容的图像检索技术备受关注。然而当前该方向的研究更多偏重于如何提高检索精度,而忽略了检索效率,这将使得该技术无法适用于海量图像数据的检索。为此,如何在保证精度的前提下,提升检索效率是当前亟需解决的难题。本项目针对基于内容的海量图像检索技术进行研究。初期阶段针对图像检索技术的基础内容进行研究与改进;中期阶段针对图像索引机制及索引之上的快速检索和反馈技术进行研究。后期阶段偏重于理论与实际相结合,构建包括"Photo As Query"、图像过滤等具有极大应用前景的典型示范,从而实现实际意义上的海量图像检索。通过本项目的研究可进一步提升我国在多媒体信息检索领域的创新力。
Content based image retrieval;Image respresentation;Distributed computing;Big data;Information retrieval
随着多媒体技术的不断发展,日常生活中的图像数量呈现爆炸性的增长,海量图像检索已成为当前亟需解决的问题。本项目围绕着海量图像数据的高效检索技术这一主要问题,开展各项研究工作,包括海量图像数据的高效特征表示方案、海量图像数据的字典构造及结果融合机制、海量图像特征数据的快速处理机制三个方面。 在海量图像数据的高效特征表示方面,项目提出了图像的显著性表示、支配描述符选择、哈希二进制表示以及形状数据的紧致表示等;在海量图像数据的字典构造及结果融合机制方面,项目提出了基于小波分解的字典构造、字典的笛卡儿积分解、基于Skyline技术的检索结果融合、基于新型核函数的结果反馈机制等;在海量图像特征数据的快速处理机制研究方面,项目提出了并行可扩展的Kmeans++聚类及其改进、分布式环境下的近邻查找及反近邻查找、大规模数据的动态Skyline点和静态Skyline查找等。在上述研究中,我们在理论和实际中均取得了一些成果,受到国内外同行的认可。 项目执行期间,在国内外刊物及会议上发表学术论文22篇,其中SCI 检索论文10篇,EI 检索论文11篇,完成培养博士研究生2人,硕士研究生27人。项目组承办了国际学术会议ICA3PP 2014和U-Science 2014,参加国际学术会议20余人次,其中担任会议组委8人次。