本项目以视频转码的应用为背景,重点面向我国具有自主知识产权的AVS视频编码标准,兼顾其他国际标准,以大幅度提高视频转码速度同时能保证压缩性能不受明显影响为目标,研究变换域视频转码中漂移误差模型和率失真模型。从矩阵论的相关理论入手,研究系数变换矩阵的表达式,并利用矩阵论及蝶形运算等相关理论知识,研究各种标准间转码的变换矩阵的快速算法;研究计算各种标准间转码的漂移误差的闭式表达式和快速算法;基于概率论和模式识别等相关理论,提出一种描述漂移误差分布的先验概率模型,并研究模型参数的计算方法。在转码系统中,提取码流中的相关特征,计算模型参数,最后利用该模型,快速估算出漂移误差;在漂移误差的计算值或估算值基础上,研究快速补偿方法;基于拉格朗日乘子法,系统地研究变换域的率失真模型,利用输出标准下的变换系数对失真和码率进行度量;研究变换域中编码参数的快速选择算法,从而进一步节省率失真模型的运算。
video transcoder;support vector machine;color space;flame detection;
项目研究按照计划进度,对视频转码中的几个关键问题进行了研究。主要包括: 1) 基于H.264的视频转码研究,其中主要包括同时支持时间、空间、比特率转码的视频转码的研究。提出了一种基于支持向量机的宏块类型选择方案,从分类的视角解决视频转码中的宏块类型选择问题。本研究从比特流中提取已编码宏块类型,运动矢量,残差数据,量化参数等信息作为特征,并组成特征向量,待编码宏块的类型由该特征向量确定,并由支持向量机分类决策。另外,研究中还采用拉普拉斯模型来描述比特流中的运动矢量,从而大幅度降低了计算复杂度。并进一步的给出了基于H.264的视频整体转码方案;2)基于任意比例因子的空间分辨率的视频转码研究。针对任意比例因子转码中待编码宏块边界无法与已编码宏块边界对齐的问题,本研究提出了影射块和覆盖块的概念,并根据缩放因子自动调整,从而解决了宏块边界无法对齐造成的不易估算运动矢量,不易估计宏块类型的问题;3)针对同一幅图像可能会采用不同颜色空间且需要在颜色空间之间进行快速转换的问题,本研究提出了一种YCbCr颜色空间到HSV颜色空间的快速转换算法。该算法把浮点乘法运算通过移位、整数乘法、加法、查表法等方法来实现,在保证对实际应用环境中几乎不受任何影响的前提下,大幅度地降低了运算复杂度;4)本研究还扩展到了视频分析领域。利用火焰区域常常处于人类比较关注的图像区域的特点,结合局部二值模式具有很好的图像局部描述特性,并融合了火焰的颜色特征,提出了一种静态图像/视频序列中火焰检测算法。另外,项目组还提出了一种通过深度图像对3D行人目标进行检测与跟踪的算法,解决了采用固定摄像机带来的难以处理行人处于图像边缘的问题。