摘要:视频编码技术是多媒体应用中的一项关键技术,压缩有效地降低了视频存储需要的内存和传输需要的带宽,减少了传输的开支。因此,学术界和工商界一直都在努力提高数字视频压缩技术。快速发展的IPTV业务成为中国信息领域的一个焦点,但经过长时间在中国多个城市的试验后其业务模型依然没有完全成熟,因此如何选择合适技术的问题成为一个短时期难以回答的问题。本文首先介绍了视频编码技术与IPTV的基本技术,然后按照发展历程对它们的发展趋势做了一个简单的综述。
关键词:视频编码 MPEG 流媒体 IPTV 发展趋势
在多媒体计算机系统中,要处理、传输、存储多媒体信息,主要包括数字、文本、图形、图像、视频等媒体类型,由于这些媒体的表示在计算机系统中以大量数据存在,再加上通信带宽和存储容量的限制,大量的信息必须进行编码处理。多媒体计算机的关键技术是关于多媒体数据的压缩编码和解码算法,80年代以来,国际标准化协会(ISO)、国际电子学委员会(IEC)和国际电信联盟-电信标准分部(ITU-T)等国际组织制定了三个重要的多媒体标准:JPEG标准、H.26x标准和MPEG标准,取得了辉煌的业绩。这些标准是由多个组织和专家共同讨论通过的,对任何用户都是公开的,只需要极少的费用,任何用户都可以实现这些标准,并且这些标准采用不同的压缩技术、传输机制,具有不同的技术特点。
1、视频压缩的基本技术
1.1 离散余弦变换DCT
DCT是一种空间变换,在现有的视频压缩编码标准中,DCT以8×8的像块为单位进行,生成的是8×8的DCT系数数据块。DCT变换的最大特点是对于一般的图像都能够将像块的能量集中于少数低频系数DCT系数上,即生成8×8DCT系数块中,仅左上角的少量低频系数数值较大,其余系数的数值很小,这样就可能只编码和传输少数系数而不影响图像质量。DCT不能直接对图像产生压缩作用,但对图像的能量具有很好的集中效果,为压缩打下了基础。 量化器 图像数据转换为频率系数后,还得接受一项量化程序,才能进入编码阶段。量化是针对DCT变换系数进行的,量化过程就是以某个量化步长去除DCT系数。量化步长的大小称为量化精度。量化步长越小,量化精度就越细,包含的信息越多,但所需的传输频带越高。DCT变换系数中,低频系数对视觉感应的重要性较高,因此分配的量化精度较细;高频系数对视觉感应的重要性较低,分配的量化精度较粗,通常情况下,一个DCT变化块中的大多数高频系数量化后都会变为零。 Zig-Zag扫描与游程编码 DCT变换产生的是8×8的二维数组,为进行传输,还须将其转换为一维排列方式。有两种二维到一维的转换方式,或称扫描方式:Zig-Zag扫描和双扫描。 熵编码 量化仅生成了DCT系数的一种有效的离散表示,实际传输前,还必须对其进行比特流编码,产生用于传输的数字比特流。熵编码是基于编码信号的统计特性,使得平均比特率下降。游程和非零系数既可独立地,也可联合地进行编码。熵编码中使用较多的一种是Huffman编码。
1.5 运动估计
运动估计使用于帧间编码方式,通过参考帧图像产生对被压缩图像的估计。运动估计的准确程度对帧间编码的压缩效果非常重要。如果估计作的好,那么被压缩的图像与估计图像相减后只留下很小的值用于传输。运动估计以宏块为单位进行,计算被压缩图像与参考图像的对应位置上的宏块的位置偏移。这种位置偏移是以运动矢量来描述的,一个运动矢量代表水平和垂直两个方向上的位移。 运动补偿 运动补偿是指在编码端估计出图像中运动部分在相邻两帧间的位移,然后用类似静态图像预测编码的方法去编码运动补偿是基于16×16子块的算法,每个子块可作为一个二维的运动矢量处理,它使用于单纯性预测(因果预测)和非因果预测(插补)。
2、视频压缩编码的发展
2.1 ITU-TVCEG H.261 1990年,国际电报电话咨询委员会CCITT所属的视频编码专家组的 H.261 建议被通过,成为可视电话和电话会议的国际标准。它可以根据传输的带宽来调整图像质量,以达到刚好吻合的程度。H.261是此前视频压缩编码数十年研究的结果,成为以后JPEG和MPEG编码方法的重要基础。 (2) H.263 由于 H.261 标准的码率较高,为了能在普通公用电话网或移动电话网上传输视频信息。ITU-TSG15于1996年3月正式发布了H.263建议。H.263是对H.261的扩充,它以混合编码为核心,原始数据和码流组织也类似,但支持更多的原始图像分辨率并吸收了MPEG等标准中有效、合理的内容,因而性能明显优于H.261。
(3) H.263+ 为了提高应用范围和提高压缩效率,ITU-TSG15于1998年1月公布了 H.263建议版2,即H.263+视频编码协议。H.263+图像形状和时钟频率也有多种选择,拓宽了应用范围;另一重要的改进是可扩展性,它允许多显示率、多速率及多分辨率,增强了视频信息在易误码、易丢包异构网络环境下的传输,尤其是在无线环境下的传输。
(4) H.26L 一般的讲,视频压缩标准都是提高压缩比为目标,编码时不考虑传输信道特性,而越来越多的应用是基于因特网或者无线网络的,如果不考虑网络特性就无法有效的保证视频在网络上传输的质量;同时无线网络技术的发展,需要符合移动信道特性的极低码率、可扩展视频编码标准。
H.26L就是基于这两个目标,由国际电信联盟视频编码专家小组VCEG在1998年开始制定的下一代视频编码标准草案。2001年 12月,VCEG同运动图像专家组MPEG成立了联合视频小组JVT(JointVideo Team) ,在H.26L的基础之上,共同制定H.26L标准草案,其成果将成为MPEG-4的第十部分与ITU H.264,在 ITU-T内部仍然称为 H.26。
图1 H.264的结构图
H.264是新一代的基于网络的视频压缩标准,它在体系结构能够实现在一定网络特性条件下的最优视频压缩性能,使网络错误对视频质量的影响最小。H.264 设计的一个新特色是它在 VCL (VideoCodingLayer)和 NAL(Network Adaptation Layer)之间引入了一个概念上的划分(如图1所示)。
2.2 ISO/ IECMPEG
(1) MPEG- 1/ MPEG- 2 近年来,电视领域里发生了一系列巨大的变化,会议电视、VCD、数字电视以及高清晰度电视(HDTV)等技术和新系统正迅速走进生活。与传统的模拟电视相比,这些新系统的突出特点是采用了全数字的图像/声音处理技术。随着这些数字电视系统的日益成熟和不断发展,针对不同的应用领域,活动图像专家小组MPEG(MovingPicture Exports Group)也制定了一系列相应的数字视频音频编码标准,即MPEG-1和MPEG-2等。MPEG-1主要是针对运动图像和声音在数字存储时的压缩编码,MPEG-2则针对数字电视的视音频压缩编码,对数字电视各种等级的压缩编码方案及图像编码中的划分的层次作了详细的规定,其编码效率可从3-100Mbps。MPEG的基本编码过程与 H.261相似,即通过DCT进行帧间压缩。除了在编码语法上加进了一些特别的规定外,与 H.261的一个重要不同是MPEG在预测编码中加进了一个双向预测帧B帧。由于MPEG-1的图像质量达不到电视质量,因此在MPEG-1视频标准的基础上,专门针对数字电视制定了MPEG-2标准。MPEG-2一个最重要的扩充就是引入了“可伸缩性”(Scalability)概念以实现“可分级”(Layer)视频压缩编码。同时为了保证最大限度的可交换性和互操作性,MPEG-2引入了档次(Profile)和等级(Level)的视频体系结构。