基于图像的三维建模方法一直是图形学领域研究的热点问题,具有真实感强的特点。但是该方法是基于传统的图像处理技术,通过分析图像像素特征来提取三维建模的几何信息和外观纹理质感信息,与人类视觉系统的处理机制相比,处理速度和准确度都相差甚远。特别是当图像破损太多、信息不全时,三维建模工作无法完成。人类视觉系统对图像的感知能力具有速度快、判断准确的优势,它能消除图像中的干扰信息,甚至从残缺的图像中能推断出缺失的信息,从而可准确快速地重现三维模型。模拟人类视觉系统的基于图像的三维建模方法是对这一类建模方法的创新。本项目拟研究人类视觉中图像和三维模型的表示方法、图像和三维模型在人类视觉和计算机视觉之间的信息映射、人类视觉从图像中构建三维场景的机理和过程等关键问题,目的是能快速、准确地提取图像中的几何信息和质感纹理信息,快速地构建物体的三维模型。这种全新建模方法对创新计算机图形学理论和实际应用都有重要意义。
3D modeling;modeling based on image;human vision system;virtual reality technology;
三维建模是计算机图形学研究领域一项长期的研究课题,国内外学者们已提出了各种建模方法。其中基于图像的三维建模方法具有真实感强的特点,但是该方法是基于传统的图像处理技术,通过分析图像像素特征来提取三维建模所需要的几何信息和视觉外观纹理质感信息,与人类视觉系统的处理机制相比,处理速度和准确度都相差甚远。特别是当图像破损太多、信息不全时,三维建模工作无法完成,限制了其发展和应用。人类视觉系统对图像的感知能力具有速度快、判断准确的优势,它能消除图像中的干扰信息,甚至从残缺的图像中能推断出缺失的信息,从而可准确快速地重现三维模型。项目组通过对所获取的人类视觉图像数据进行分析,提出人类视觉中图像的表示方法,分析对比计算机图像数据和人类视觉中的图像数据,建立能表达人类视觉图像的数学模型;在此基础上,探索基于人类视觉机理从图像构建三维场景的过程,研究快速建立三维几何模型方法;同时结合计算机视觉中基于图像建模的传统方法,对三维模型进行精化,并以高速列车三维仿真系统的三维建模为例,建立相关的三维模型。通过对以上内容的研究,提出一种模拟人类视觉机理的PCNN图像分割算法,将图像像素看成是大脑神经元,在外界输入的刺激下,通过循环迭代的方式发放脉冲,模拟人脑视觉皮层的工作方式,在对图像进行分割的过程中,引入了最大方差比准则对分割过程进行判定,寻找最佳分割点,通过对直方图分别为单峰、双峰和多峰的图像进行实验分析,证明了算法的有效性;提出了一种结合小波变换和PCNN模型的图像融合方法,该方法在对图像分解和系数选择上模拟了人类视觉机理,并从定性和定量的角度对所提方法进行验证,结果表明该方法的图像融合效果较好,符合人的视觉感知;提出了一种结合颜色、亮度、方向和纹理四种底层特征的显著区域提取算法以及一个基于眼动数据的图像显著区域提取模型;提出了一种模拟人类视觉机理的网格融合方法,解决了大交叠区的融合和拼接问题;提出了一个基于视觉感知的大规模轨道线路动态建模方法,利用该方法,可实现根据给定的轨道线路数据进行快速的、高真实感模型的动态建模,能在大规模大三维轨道场景中以任意视点、任意视角进行实时的运行仿真,以及对虚拟场景进行实时渲染显示。