视频拼接是为克服单个摄像头视场过小、广角摄象头畸变较大等缺陷,利用图象动态拼接技术产生视野范围更大的视频图像。传统的图象拼接算法大多基于零视差模型,现有的少数视差图象拼接算法都存在速度慢、非致密等局限性。针对存在问题,本项目拟就多通道摄象机对极几何估计、最小化畸变的图象校正、视差图象全局配准及无缝合成等关键技术展开研究。在此基础上,尝试将研究成果应用到大型军用特种车辆驾驶员视觉辅助增强中,通过将车身周围多通道同步图象拼接,输出一路准全景视频给驾驶员,以提高驾驶的安全性和车辆的机动性,因此该课题的研究具有重大的军事意义。同时,该课题涉及的研究内容也是计算机视觉领域的基础性问题,研究成果可广泛应用于图象工程和计算机图形等领域,因此本课题的研究对于推进相关领域技术水平的提高也具有重要的学术价值和现实意义。
研究了对极几何估计、图像校正、图像配准及图像合成等视差图像拼接的关键技术。将运动目标检测技术应用到基础矩阵的求解中,提出了基于序列目标检测与跟踪的基础矩阵求解方法,提高了基础矩阵求解的鲁棒性;提出了最小化畸变的广义规范化图像校正方法,解决了图像校正过程中的射影畸变和图像重采样效果最小化问题;利用小波变换的多分辨率特性,提出了基于小波近似图像和垂直细节图像由粗到精的加权全局配准策略,提高了图像配准的速度、准确性和可靠性;分析了现有视差图像合成处理方法的不足,将遗传算法引入到图像最优拼缝搜索中,提出了一种基于小区间整数编码,个体互异稳态定标的组合选择策略,按基因适应度自适应重组,自适应、变步长与多点选择性变异操作等策略的改进遗传算法,提高了算法收敛速度,视差图像的合成效果满足可视化要求;完成了基于DSP的图像处理系统在大型发射车上的应用研究。在项目研究过程中,对支持向量机理论进行了跟踪,并对其相关理论及其在图像检测中的应用进行了研究。