眼动及其伴随的注意选择机制在人类视觉系统对场景进行特征选择、信息编码和行为控制的过程中起着至关重要的作用。对此进行深入的认知机理分析并用于构建高效的主动视觉计算模型具有重大意义。目前,对选择性注意机制在由低向上的显著性映射方面研究得比较充分,但在由顶向下的感兴趣物体或目标的主动视觉搜索和注意机制方面还研究不足。相应地,多数主动视觉模型对实际快速变化场景及其中的物体或目标还缺乏高效的信息抽取、编码和动作控制能力。本项目着重研究的核心问题和技术是一、通过眼动仪和脑电仪同步记录人对变化场景的注意选择和相关反应动作,阐释感兴趣物体或目标的注意选择和眼动控制机制;二、在本项目组先期提出的原创性"视觉感知-眼动控制神经网络系统"的基础上,根据认知分析新结果建立一个更先进的由低向上和由顶向下双向结合的主动视觉计算和动作控制模型;三、将新的主动视觉模型应用于驾驶行为的学习和模拟上,验证系统的有效性。
attention;neural coding;visual perception;eyeball-movement control;active vision
眼动及其伴随的注意选择机制在人类视觉系统对场景进行特征选择、信息编码和行为控制的过程中起着至关重要的作用。对此进行深入的认知机理分析并用于构建高效的主动视觉计算模型具有重要意义。? 本课题从三个方面开展研究一、自底向上的显著性感知和信息编码;二、自顶向下的上下文场景与目标的认知编码及动作控制;三、自底向上和自顶向下相结合的主动视觉-动作控制模型。 在第一个方面,本课题通过对视点数据的分析提出了两个视觉选择性注意模型基于小世界稀疏互联结构和基于空间加权的图像显著性感知计算模型,通过与真实人眼视点基准测试库对比取得了领先的预测效果。基于视觉显著性计算模型和独立元分析,提出一种基于显著性和ICA的静态图像信息编码方法。本课题还研究了如何通过视觉感知神经元的脉冲同步振荡实现特征捆绑和轮廓编码,相应地提出了采用FitzHugh-Nagumo振荡子的脉冲同步发放模型。 在第二个方面,本课题采集了十余名被试注视或搜索图像目标时的视点变化轨迹,着重分析了注视和搜索过程中视点的分布规律,同时调研了图像稀疏编码的现状。据相关规律,提出了改进的基于自组织的上下文编码与视点运动控制模型,并提出了基于注意选择的目标表示和识别方法。在University of Bern、FERET等基准图像库上的实验表明这些模型和方法取得了明显的改进,主要表现为上下文和目标编码量大幅减少,检测和识别率上升。 在第三个方面,本课题实现了一个自底向上、自顶向下及眼动习惯相结合的主动视觉模型。模型所模拟的视点运动序列与用眼动仪采集的真实视点序列取得了86%的相对一致性,显示了模型的视觉认知特性。课题组对虚拟驾驶进行了初步的认知分析,并将主动视觉的方法应用于虚拟道路和车辆的检测上,实验表明了良好的检测性能。 以上有关研究成果在二十多篇知名国际国内学报和会议上发表或接受,并申请专利三项,其中已有一项获得授权。本课题负责人因在主动视觉理论和技术上的探索工作,受到了国际神经信息处理会议和国际脑智研究所的邀请主持和参与了相关学术活动。本课题共培养博士和硕士研究生共8名,其中一名博士生在学期间获得国际会议ICONIP的最佳学生论文奖。