融合多视点深度场的三维视频技术是当前国际研究热点,涉及计算机视觉、图像视频处理等多个学科领域的交叉。多视点数据量庞大,深度场精度受限,视觉场缺乏空间机理的精确刻画,给三维视频的高效压缩与精确重建带来极大挑战。如何精确刻画场景空间机理、深度发掘视觉场与深度场内在关联冗余、以及精确重构编码失真条件下的三维场景是前沿挑战难题,涉及核心问题包括深度场精度优化、深度场与视觉场联合编码、场景优化重构等。本项目针对三维视频多视点深度场与视觉场间内在关联特性,建立时空约束的风险评估全局优化模型,探索深度场精度提升方法;通过高精度深度场建立多视点几何映射的高效预测模型,提高三维视频深度场与视觉场的压缩性能;构建解码信息置信度模型,形成数据失真条件下的场景精确重建,实现融合多视点深度场的三维视频高效压缩与精确重构。本项目可实现多视点深度场与视觉场处理及重构的理论创新与技术突破,促进三维视频的广泛应用。
英文主题词multiview depth;video compression;3D reconstruction;3D video;