随着网络多媒体应用不断发展,在异构网络环境中,迫切需要解决通过不同的传输网络、不同的终端设备、根据用户个性化喜好存取相同媒体资源的问题,即通用多媒体存取。压缩视频转换编码(简称视频转码)由于具有动态地改变压缩视频编码参数的能力,可以屏蔽网络环境的异构性,将在解决通用多媒体存取中起到重要作用,成为当前研究热点。目前对适应异构网络环境的视频转码研究还不够,存在许多问题需要解决。本项目将面向异构网络环境,研究能够实时动态地完成码率、空域分辨率、帧率以及编码格式等多种转换的视频转码结构与关键技术(运动合成、码率控制等),并结合视觉模型,充分挖掘已有编码数据信息,力求达到转码的计算复杂度与视频质量的优化折中。在此基础上构建视频转码应用系统,推动通用多媒体存取的实现。
在三年的项目实施期内,按照项目计划内容,面向异构网络环境研究了能够实时动态地完成码率、空域分辨率、帧率以及编码格式等多种转换的视频转码结构与关键技术(压缩域转码技术、快速运动估计、码率控制技术、结合视觉模型转码技术和视频转码的复杂度管理)。提出了多功能视频转码体系结构,基于该体系结构的视频转码器可以实时动态地完成码率、空域分辨率、帧率以及编码格式等多种转换。对于压缩域转码技术,提出了MPEG-2 到H.264压缩域视频转码中系数快速转换方法,有效解决了在压缩域上直接进行MPEG-2 到H.264 DCT系数转换的难题。提出了跳帧转码中运动矢量复用方法,在理论上给出了视频压缩域半像素滤波的优化公式,解决了压缩域转码中半像素运动补偿效率低的难题。在国际上首次提出了符合率失真理论的H.264码率控制方法,并将其引入到MPEG-2 到H.264转码码率控制中。提出了结合Foveation视觉模型的转码技术,有效利用人眼视觉特提高转码效率。提出了一种视频转码中复杂度管理机制与方法,可以在转码过程中对计算复杂度进行有效控制。最后基于上述研究成果,构建了视频转码应用演示系统。