位置:立项数据库 > 立项详情页
基于选择性注意模型的可视媒体文本检测方法研究
  • 项目名称:基于选择性注意模型的可视媒体文本检测方法研究
  • 项目类别:重大研究计划
  • 批准号:90920008
  • 申请代码:F030403
  • 项目来源:国家自然科学基金
  • 研究期限:2010-01-01-2012-12-31
  • 项目负责人:刘跃虎
  • 负责人职称:教授
  • 依托单位:西安交通大学
  • 批准年度:2009
中文摘要:

文本检测是可视媒体高层语义分析、自动语义标注和内容检索的关键技术之一。本项目的目标是借鉴人类视觉感知与认知的选择性注意与反馈特性,把文本显著特征的先验知识引入传统的视觉选择注意计算模型,针对可视媒体中的文本区域,选择文本模式的特殊显著特征,通过视觉底层特征与高层知识的协作,形成Bottom-up和Top-down的反馈结构,构建适合于文本检测任务的视觉选择注意计算模型。该模型通过选择性显著特征提取、特征显著图的竞争与协同计算、以及视觉显著图的级联检测,解决可视媒体文本显著区域的快速检测问题。

结论摘要:

本项目借鉴人类视觉感知与认知的选择注意与反馈机理,针对视觉对象检测的层次认知计算模型,通过局部单元解析逐步实现对视觉对象的整体认知;探索了自然场景图像文本区域的快速检测、随机森林形状片段上下文样本学习的物体检测以及场景高层语义目标检测与属性计算的理论问题;所提出的一种基于网格模型预测的文本图像几何变形恢复方法的相关论文已在2012年IEEE T-PAMI上发表,此外,研究开发了两个具有完全自主知识产权的主动视觉识别系统文本内容变化的非编码快速检测系统、大场景微小目标图像采集双视觉系统。


成果综合统计
成果类型
数量
  • 期刊论文
  • 会议论文
  • 专利
  • 获奖
  • 著作
  • 12
  • 13
  • 0
  • 0
  • 0
相关项目
刘跃虎的项目