计算机视觉技术在车辆辅助安全驾驶系统中的应用近来逐渐成为一个研究热点。车辆辅助安全驾驶需要从行驶视频中获取整个场景的语义和空间配置信息,对各种行驶状态和可能的突发事件进行判断。传统的方法主要集中于具体特征的设计以及某种特定任务的应用上,而较少分析图像和视频空间的数理结构和分布特性,缺乏较为完善的将图像和视频两个层面统一起来的视觉模式表达理论,以及相应的学习与高效运动分析算法。本项目以复杂视频智能系统为应用背景和目标,研究基于认知的各个层次的视觉模式表达以及运动分析和识别理解的高效算法。具体探讨单质的图像基元、视频基元、一般性的图像和视频模式表达、以及高层物体的统一外观和运动的模板表达。并且基于这些视觉表达模型,研究在车辆行驶视频中的自适应跟踪和感兴趣物体分割、识别等实际应用问题。本项目的研究成果将具有重要的科学意义和潜在的应用前景。
Visual pattern representation;Visual primitive words;Video understanding;Action recognition;Intelligent vechicle
计算机视觉在车辆智能驾驶系统中的应用已经成为一个研究热点。车辆智能驾驶需要从行驶视频和图像中感知整个场景的语义信息和空间配置信息,包括行车线路、路标、交通指示灯以及其它车辆与行人等目标信息和相互空间关系,完成对各种行驶状态和可能的突发事件进行判断和决策。针对这一应用背景,本项目完成了基于认知的各层次的视觉模式表达以及针对场景目标运动分析和理解识别的高效计算方法;提出了视频时空块的混合流形表示方法,建立可以处理复杂光照变化的背景流形模型,并成功用于背景建模;提出了场景和物体的与或图表示方法,能够高效地实现在复杂背景下对同一类型的不同实例物体的识别检测,并且能够利用学习出的物体先验模型预测物体缺失部件;提出了目标推理和意图预测的事件语义分解方法,在事件层次上对复杂视频进行语义理解;提出目标行为识别与理解的机器学习方法,实现在低维度上复杂场景中目标行为的识别和理解。在国际顶级会议CVPR、ICCV、ECCV上发表学术论文6篇,在IEEE T-CSVT、Pattern Recognition、CVIU等国际重要学术刊物发表学术论文11篇。本项目研究成果可应用于智能车辆视觉感知系统,也可以应用于智能监控、智能信息检索、人机交互等智能系统。