本项目针对图像处理中广泛存在的图像表象的复杂性、图像内容的结构性层次性、应用需求的多样性等挑战性问题,以相位奇点作为分析工具,建立一类全新的图像表示方法,开发相应的图像分析和识别算法。我们将分析相位奇点用于图像表示的基本属性,研究相位奇点及其平面结构和空间层次对于噪声、变换、形变等的稳定性,明确其蕴含的图像信息。我们将提出描述相位奇点周边纹理的局部特征,开发相位奇点结构和层次的描述语言,并以此为基础创建基于相位奇点的图像表示模型。本项目还将开发算法以选择那些对图像处理和识别有重要作用的关键相位奇点及结构。我们计划探索基于相位奇点的图像表示分析方法与人脑视觉皮质信息处理机制间的关系。最后,我们将以图像匹配和对象识别为例,研究如何将本项目所开发的理论、模型和算法应用于实际问题。本项目的研究不仅能在理论上创建一类新的图像表示和分析方法,还能在图像跟踪、匹配、识别中得到广泛的应用。
Phase singularities;structural representation;image matching;image classification;action recognition
本项目以相位奇点和结构作为主要分析工具,建立新的图像和视频表示方法,开发相应的分析和识别算法。主要进展包括以下几个方面 1) 我们分析了相位奇点用于图像表示的基本属性,研究了相位奇点对于噪声、变换等的鲁棒性; 2) 提出了尺度空间相位奇点线以及关键相位奇点的新计算方法; 3) 研究并提出了相位奇点的局部特征,并将其应于与图像匹配; 4) 研究并开发了基于相位奇点包的图像表示方法,并将其应用于图像分类识别; 5) 研究局部特征的共存统计特性,并将其应用于场景和纹理分类; 6) 开发了基于时空兴趣点的隐层次模型用于视频表示,并将其应用与视频行为识别,在多个世界公开数据库上取得世界领先或先进的成果。基于以上成果,我们已经发表了21篇EI收录的论文,其中5篇论文发表在国际一流刊物和会议如IEEE Trans. On Image Processing, IEEE Conf. on Computer Vision and Pattern Recognition (CVPR),IEEE Conf. on Computer Vision(ICCV) ,ACM Multimedia(ACM-MM)等,4篇论文发表在知名国际会议如BMVC, ACCV等。发表论文的数量超出了申请书的预期。申请发明专利4项。