文本检测是可视媒体高层语义分析、自动语义标注和内容检索的关键技术之一。本项目的目标是借鉴人类视觉感知与认知的选择性注意与反馈特性,把文本显著特征的先验知识引入传统的视觉选择注意计算模型,针对可视媒体中的文本区域,选择文本模式的特殊显著特征,通过视觉底层特征与高层知识的协作,形成Bottom-up和Top-down的反馈结构,构建适合于文本检测任务的视觉选择注意计算模型。该模型通过选择性显著特征提取、特征显著图的竞争与协同计算、以及视觉显著图的级联检测,解决可视媒体文本显著区域的快速检测问题。
Selective Attention;Cognitive Hierarchical Model;text Detection;semantic propagation;active vision
本项目借鉴人类视觉感知与认知的选择注意与反馈机理,针对视觉对象检测的层次认知计算模型,通过局部单元解析逐步实现对视觉对象的整体认知;探索了自然场景图像文本区域的快速检测、随机森林形状片段上下文样本学习的物体检测以及场景高层语义目标检测与属性计算的理论问题;所提出的一种基于网格模型预测的文本图像几何变形恢复方法的相关论文已在2012年IEEE T-PAMI上发表,此外,研究开发了两个具有完全自主知识产权的主动视觉识别系统文本内容变化的非编码快速检测系统、大场景微小目标图像采集双视觉系统。