近年来,随着视觉信息多媒体数据的不断增多以及互联网规模的不断增长,对复杂环境下情景理解的要求也在不断提高。情景理解的质量主要取决于两方面的关键技术,即视觉信息的表达技术和标注技术。本课题拟围绕复杂环境下"感知特征提取"、"知识表达与整合"、"感知数据的学习与理解"等核心问题,主要研究视觉信息的高效计算模型,包括基于生物激励的视觉特征的提取与选择和基于知识构建的视觉信息分类,并在此基础上研究复杂环境下的知识表达和情景元素的关联性多标注方法。本课题拟进行视觉建模并开发相应算法从视觉信息的选择性显著区域中自动提取特征,最终在结构化描述体系中实现知识构建、表达、分类及标注。本课题建立的体系有效性拟在解决复杂环境下的视觉信息中显著区域的检测、海量视觉信息分类及检索等相关研究问题中得到验证。提出的模块化结构体系拟提供直接的可获取资源的扩展平台,包括用户相关反馈, 有前后关联的输入, 以及多模态信息等。
bio-inspired system;visual modeling;knowledge representation;multiple labeling;scene understanding
近年来,随着视觉信息多媒体数据的不断增多以及互联网规模的不断增长,对复杂环境下情景理解的要求也在不断提高。情景理解的质量主要取决于两方面的关键技术,即视觉信息的表达技术和标注技术。本课题围绕复杂环境下“感知特征提取”、“知识表达与整合”和“感知数据的机器学习与理解”等核心科学问题,主要研究视觉信息的高效计算模型,包括基于生物激励的视觉特征的提取与选择和基于知识构建的视觉信息分类,并在此基础上研究了复杂环境下的知识表达和情景元素的关联性多标注方法。本课题建立的体系有效性在解决复杂环境下的视觉信息中显著区域的检测、海量视觉信息分类及检索等相关研究问题中得到验证。相关工作引起了同行业专家的热烈讨论和强烈反响,并在一定程度上针对在基于生物激励机制下场景的关联性和层级性进行的图像分类、复杂环境下多视角场景和物体的聚类问题、超图聚类匹配和行为识别等方向有所创新。针对生物激励的复杂环境下模糊场景的层级分类问题,提出模拟人类大脑对于感知场景时的高效工作机制。对于复杂场景分类结果非常理想。分类器的显性表现说明类越大,分类结果越准确。该现象也是大数据时代图像处理发展的必然趋势,即该体系框架之下,通过利用海量数据信息以及高性能计算技术获得更加准确的处理结果。对于复杂环境下多视角场景和物体的聚类问题的研究,提出了一种新的基于二维图模式的聚类方法,同时分析了传统二维图聚类方法的不足之处。接着通过探discrete-time quantum walks 和图的 Ihara zeta function 的关系,分析讨论了将基于二维图表达的聚类方法扩展到高维关系表达的必要性和可行性,具体结果参见(研究工作主要进展和所取得的成果)。对于高维空间表达下进行图像特征匹配研究,提出了一套高效的图像降维匹配机制,克服了其他超图匹配理论当中经典降维方法的使用而带来的高维信息损失。该方法与传统匹配算法的效果对比非常明显,平均匹配正确率高于现阶段最精准算法15%左右。针对基于区域形状与运动特征的实时行为识别提出了一种基于推广的Hu不变矩特征的实时行为识别方法。本文的方法简单,计算量少,速度快,可以用于智能监控中的实时监测。该方法的识别率为91.7%。该方法可以很容易的应用到多类别多实例的行为场景中。