数字电视信源编码技术.ppt
《数字电视信源编码技术.ppt》由会员分享,可在线阅读,更多相关《数字电视信源编码技术.ppt(135页珍藏版)》请在三一办公上搜索。
1、Copyright 2013.Shi Ping CUC,数字电视信源编码技术,概述视频压缩编码技术视频压缩编码标准介绍MPEG2 视频编码技术H.264 视频编码技术AVS 视频编码技术视频压缩损伤分析,概述,通过压缩编码技术来去除视频、音频、数据等原始信号的冗余信息,以实现码率压缩与带宽减小,使信号在各种传输信道中能够有效传输。,1、数字电视信源编码的目的,Copyright 2013.Shi Ping CUC,2、压缩的必要性,电视信号数字化后:数码率高,数据量大。例如:4:2:2编码、8比特量化的SDTV信号,其数码率为216 Mbps。若按每2bit构成一个周期,则传输这样一路数字电视
2、信号需要有108MHz的通道带宽。4:2:2编码、8比特量化时,一帧SDTV图像的数据量约为8.6Mb,要记录10分钟的电视节目就需要130Gb的存储器容量。综上所述,要实现数字电视信号的有效存储和传输,就需要采取措施降低其数据量和数码率,Copyright 2013.Shi Ping CUC,3、压缩的可能性(以视频信号为例),视频压缩过程:去除图像中与信息无关或对图像质量影响不大的部分,即冗余部分。电视信号中存在很多这样的冗余部分,这就为压缩提供了可能性。,视频信号的冗余性表现在以下几个方面:空间相关冗余 时间相关冗余 视觉冗余 熵冗余,Copyright 2013.Shi Ping CU
3、C,空间相关冗余,Copyright 2013.Shi Ping CUC,时间相关冗余(帧间相关冗余),tt1,tt2,Copyright 2013.Shi Ping CUC,人眼视觉冗余,人眼视觉特性:对静止或缓慢运动图像的灰度等级及图像细节的分辨力高对快速运动图像的灰度等级及图像细节的分辨力低观察大面积图像时,对灰度等级分辨力高,对细节分辨力低观察细节时,对灰度等级分辨力低,对细节分辨力高,人眼接收综合信息的能力有限,Copyright 2013.Shi Ping CUC,利用人眼的视觉特性,对静止或缓慢运动图像:减小帧率在图像细节部分选择较高的取样频率和较低的量化比特数在大面积像块区域选
4、择较低的取样频率和较高的量化比特数对快速运动图像:提高帧率 降低取样频率和量化比特数,Copyright 2013.Shi Ping CUC,自信息量定义:指某个随机事件(或消息)发生后所提供的信息数量的多少,任意随机事件的自信息量为该事件发生概率的倒数的对数。,熵冗余,Copyright 2013.Shi Ping CUC,信源熵(信源每个符号的平均信息量):,P(xi)是符号xi出现的概率,平均码长(每个符号的平均编码长度):,熵冗余平均码长信息熵,li 是符号xi 的编码码长,Copyright 2013.Shi Ping CUC,例如:某一图像总共可出现4个灰度级,对每个灰度级进行二进
5、制定长编码时,码长为2比特,即 L 2bit/符号。,当每个灰度级出现的概率不相等时:设灰度级14的概率分别为1/8、3/8、3/8、1/8,,熵冗余L H 21.810.19 bit/符号,Copyright 2013.Shi Ping CUC,若采用变长编码方式,对概率大的符号赋予短码,对概率小的符号赋予长码,则可降低平均码长L,熵冗余1.8751.810.065 bit/符号,例如,灰度级1 3/8 1 灰度级2 3/8 01 灰度级3 1/8 001 灰度级4 1/8 000,所以,采用变长编码可降低信源熵冗余,Copyright 2013.Shi Ping CUC,return,视频
6、压缩编码技术,第一代视频编码技术(经典的视频编码技术):以香农信息论为基础采用基于象素或象素块的方法来表征视频信息利用图像信号的统计特性来设计编码器未考虑事件本身的具体含义、重要程度及引起后果未充分考虑人眼视觉特性对编码图像的影响只能去除数据冗余低层压缩,1、视频压缩编码技术的研究进展,变换编码:DCT+量化预测编码:MC 帧间预测熵编码:VLC,Copyright 2013.Shi Ping CUC,第二代视频编码技术:突破了香农信息论的框架采用基于内容的方法来表征视频信息充分考虑人眼视觉特性及信源特性通过去除内容冗余来实现数据压缩基于对象的视频压缩中层压缩基于语义的视频压缩高层压缩,分形编
7、码分级编码模型基编码,Copyright 2013.Shi Ping CUC,视频压缩编码用到的主要算法,统计编码,变换编码,预测编码,分析、综合编码,霍夫曼编码,游程编码,算术编码,字典编码,DCT变换编码,运动补偿预测编码,子带编码,分级编码,分形编码,模型基编码,Copyright 2013.Shi Ping CUC,2、视频压缩编码分类,按无损压缩和有损压缩进行分类:无损压缩编码、有损压缩编码,按信源模型进行分类:基于波形编码、基于内容编码,按压缩编码原理进行分类:统计编码、预测编码、变换编码、矢量量化编码,Copyright 2013.Shi Ping CUC,3、预测编码,3.1
8、预测编码的基本原理预测编码传送的不是实际像素值,而是实际值与其预测值之间的差值,即预测误差。像素的预测值由其在时间和空间上相邻的若干个像素的线性组合产生,它反映了在预测区域内各像素的共性部分,因此用像素的实际值减去其预测值就可基本去除像素间的相关性。,Copyright 2013.Shi Ping CUC,en en x Xn x,Xn en Xn x,若不考虑量化器的影响,则有Xn Xn(无损压缩),x:量化误差,Copyright 2013.Shi Ping CUC,预测编码的压缩效果取决于预测器的预测精度,精度越高,预测误差越小,量化时所需的量化比特数就越少,压缩率也就越高。一般来说,参
9、与预测的像素数越多,预测值就越精确,但同时预测器电路组成也就越复杂。利用相关像素值x1、x2 xn-1来预测当前像素值,a1、a2an-1称为相关系数,且满足:,Copyright 2013.Shi Ping CUC,3.2 帧内预测编码,由距X7最近的四个像素X6、X4、X3、X2参与对X7的预测。相关系数为:a61/2、a4 a21/8、a31/4,则:1/2 X6 1/8 X4 1/4 X3 1/8 X2,D6TS(TS为取样周期)D4THTS(TH为行周期)D3THD2THTS,Copyright 2013.Shi Ping CUC,3.3 帧间预测编码,当图像场景或摄像机静止不动时,
10、当前帧象素块的预测值就是前一时刻参考帧同一位置上的象素块;如果图像场景或摄像机是运动的,则需要在参考帧中找到与当前帧象素块最匹配的象素块,作为当前帧象素块的预测值(运动补偿帧间预测)。,Copyright 2013.Shi Ping CUC,3.4 预测编码的实质,由信息论可知,信源冗余来自信源本身的相关性以及信源概率分布的不均匀性。因此,去除信源相关性以及改变信源的概率分布模型,即可实现数据压缩。预测编码的实质是降低了图像在时间或空间上的相关性。,预测编码中:量化环节可造成图像质量下降误码传递可造成局部图像损伤,Copyright 2013.Shi Ping CUC,3.5 运动估计与运动补
11、偿,运动估计:对运动物体的位移作出估计,即求出运动矢量运动补偿:按照运动矢量,对上一帧做位移,然后求出对当前帧的预测值。,Copyright 2013.Shi Ping CUC,运动补偿帧间预测编码方框图:,Copyright 2013.Shi Ping CUC,运动估计,块匹配法:将图像分成若干个大小为MN的子像块,假定同一子像块内所有像素具有相同的位移。假定帧间最大水平位移和最大垂直位移分别为Wx和Wy个像素;对于当前帧的每一个块在前一帧相应位置开辟大小为(M+2 Wx)(N+2 Wy)的一块搜索区;在搜索区内求出当前帧对应块的最佳匹配块;求出运动矢量。,Copyright 2013.Sh
12、i Ping CUC,M+2Wx,N+2Wy,N,M,Copyright 2013.Shi Ping CUC,j,i,j:垂直位移量i:水平位移量,Copyright 2013.Shi Ping CUC,块匹配准则:均方误差(MSE)最小准则,绝对误差均值(MAD)最小准则,Copyright 2013.Shi Ping CUC,最大归一化互相关函数(NCCF)准则,Copyright 2013.Shi Ping CUC,搜索方法:穷尽搜索法:对搜索区域内的每一点都用匹配准则进行计算。,二维对数法,三步搜索法,分块全搜索法:,Copyright 2013.Shi Ping CUC,4、变换编码
13、,4.1 变换编码的基本原理,通过一种线性运算关系将空间域的图像信号变换到变换域或频率域的正交矢量空间,然后进行编码。,Copyright 2013.Shi Ping CUC,变换编码的根本目的是去除图像的相关性!,K-L 变换:最佳正交变换,变换后系数互不相关,而且能量主要集中在少数系数上。但K-L变换矩阵不是固定的,而是与图像统计特性有关,因此没有快速算法,只适合进行理论分析与实验。,DCT 变换:次最佳正交变换,变换压缩性能接近K-L变换,具有良好的去相关性及能量压缩特性,同时变换矩阵是固定的,与图像内容无关,有快速算法。DCT变换在图像压缩领域得到广泛应用。,变换编码中对变换系数的量化
14、是造成图像损伤的主要原因。图像损伤的表现形式主要是块效应。,Copyright 2013.Shi Ping CUC,DCT 变换编码的特点:在变换域中描述视频图像要比在空间域中简单视频图像的相关性明显下降,信号的能量主要集中在少数几个变换系数上,采用量化和熵编码可有效地压缩其数据量可充分利用人眼的视觉特性具有较强的抗干扰能力,传输过程中的误码对图像质量的影响远小于预测编码DCT有快速算法,能实现实时视频处理,Copyright 2013.Shi Ping CUC,4.2 离散余弦变换(DCT),设图像块的样点数为NN,其样值方阵用f(x,y)表示,则二维离散余弦变换的公式为:,Copyrigh
15、t 2013.Shi Ping CUC,图像分块及变换:通常将图像分解成88的像素块,然后进行DCT变换。变换后得到由88频域系数组成的矩阵。,F00:DC系数,代表该像素块的直流分量或平均亮度值其它为AC系数,Copyright 2013.Shi Ping CUC,一般电视图像的构成都是以大、中面积内容为主,精细内容较少,因而可估计到,系数矩阵中左上方的系数值会大些,而越接近右下角,系数值会越小,Copyright 2013.Shi Ping CUC,利用人眼的视觉冗余性左上角附近的系数细量化(量化间隔小)右下角附近的系数粗量化(量化间隔大)量化后的系数取整F(u,v)F(u,v)/Q(u,
16、v),4.3、DCT系数量化,Copyright 2013.Shi Ping CUC,5、熵编码,5.1 熵编码的基本原理,根据图像的统计特性来去除图像象素值的概率分布不均匀性,使编码后的图像数据接近于其信源熵,同时不产生任何失真。,基于图像概率分布特性的霍夫曼编码、算术编码基于图像相关性的游程编码,Copyright 2013.Shi Ping CUC,5.2 可变长编码(VLC),按信源符号出现概率的不同分配给不同长度的码字比特数。即出现概率大的符号编码码字短,出现概率小的符号编码码字长。也称可变长编码(VLC)前提条件:必须知道每个符号的出现概率特点:具有单义可译性。即:任何一个长码都不
17、会是另两个短码复合而成,任何一个短码不会是另一个长码的前缀。因此,收信端可从接收到的码字串中分断开每个码字,不会发生码字混淆。,Copyright 2013.Shi Ping CUC,是一种最优可变长码,基本原理为:将信源发出的符号按出现概率的大小次序排列对两个概率最小的符号分别赋以“0”、“1”,并将这两个概率相加之后作为一个新符号的概率对符号概率重新排队后再取两个概率最小的符号分别赋以“0”、“1”,并将这两个概率相加依此类推,直到所有概率相加得到1为止由后向前沿各支路逐一写出“0”、“1”,此码字即为霍夫曼编码码字,5.3 霍夫曼编码,Copyright 2013.Shi Ping CU
18、C,例如:设信源各符号出现的概率为:,符号(xi),概率(Pi),x1,x2,x3,x4,x5,x6,x7,x8,0.20,0.19,0.18,0.17,0.15,0.10,0.005,0.005,0.01,0.11,0.26,0.35,0.39,0.61,1.00,码字(wi),01,00,111,110,101,1001,10001,10000,Copyright 2013.Shi Ping CUC,信源熵:,采用等长编码方式时,每个符号需要3bit,即平均码长为3bit/符号,熵冗余为0.38 bit/符号。采用可变长编码时,平均码长为:,熵冗余为0.11 bit/符号,Copyrigh
19、t 2013.Shi Ping CUC,5.4 DCT系数的熵编码,MPEG2中,像素块矩阵经DCT变换、量化后,要进行Z形扫描、游程编码和霍夫曼编码,Z 形扫描:,Copyright 2013.Shi Ping CUC,游程编码:将一维序列用二维数组(run,level)表示。run:表示连零的长度level:表示连零之后出现的第一个非零值当所有值都为零时用符号EOB表示,Z形读出158,0,-1,-1,-1,-1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
20、,0,0,0,0,0,0,0,0,0,0,0,0,0,游程编码:(0,158),(1,-1)(0,-1),(0,-1)(0,-1),EOB,Copyright 2013.Shi Ping CUC,DC系数:差值编码(DPCM),霍夫曼编码;即:DIFFDCi DCi-1对DIFF进行霍夫曼编码AC系数:游程编码,霍夫曼编码,MPEG2中,AC系数游程编码:(1,-1)(0,-1),(0,-1)(0,-1),EOB,Copyright 2013.Shi Ping CUC,DC系数的DIFF熵编码(查表法),编码码字码字1码字2 若DIFF2,则码字为 01110,Copyright 2013.S
21、hi Ping CUC,AC系数熵编码(表1),Copyright 2013.Shi Ping CUC,AC系数熵编码(表2),Copyright 2013.Shi Ping CUC,对于(1,-1):AC系数为-1,前面有1个零查表1 可知,码字2为0,“游程/位长”是1/1查表2 可知,1/1对应的码字1为1100对(1,-1)进行霍夫曼编码的码字为11000同理可得,(0,-1)的编码码字为 000EOB的码字为 1010,AC系数游程编码:(1,-1)(0,-1),(0,-1)(0,-1),EOB,该图像块编码后为:,01110 11000 000 000 000 1010,Copyr
22、ight 2013.Shi Ping CUC,视频压缩编码标准介绍,国际电信联盟(ITU)开发用于低比特率视频电话的 H.26x 标准,其中包括 H.261、H.262、H.263 与 H.264;国际标准化组织(ISO)主要针对消费类应用,已经针对运动图像压缩定义了 MPEG 标准。MPEG 标准包括 MPEG1、MPEG2 与 MPEG4;MPEG与ISO开展合作,成立联合视频小组(JVT),该小组定义了 H.264 编解码技术,该标准称为H.264/AVC。,Copyright 2013.Shi Ping CUC,发展历程:,Copyright 2013.Shi Ping CUC,视频电
23、话和视频会议压缩编码标准CCITT 1984年开始研究,1990年正式成为标准应用:视频电话、视频会议,传输网络为ISDN(综合业务数据网,64kb/s2.048Mb/s)图像格式:CIF、QCIF,最大帧频为30Hz,逐行扫描码率:p64kb/s(p130)。p1、2时,只支持QCIF格式,用于视频电话。p6时,支持CIF格式,可用于视频会议。压缩方式:DCT、帧间预测编码,H.261,Copyright 2013.Shi Ping CUC,低码率图像压缩编码标准ITU-T 1995推出草案应用:视频电话、多媒体通信、移动通信、远程监控系统等,传输网络为PSTN(公用电话交换网)图像格式:C
24、IF、QCIF、sub-QCIF(Y:12896,CR/CB:6448),最大帧频为30Hz,逐行扫描压缩方式:DCT、帧间预测编码,H.263,Copyright 2013.Shi Ping CUC,先进的视频编码AVC由ITU-T和ISO/IEC的联合专家组(JVT)于2003年3月起草完成应用:数字电视广播、可视电话、视频会议、实时监控、流式多媒体业务、低比特率下的移动多媒体通信等特点:在同等图像质量条件下,压缩比是H.263和MPEG4的2倍对IP和无线网络环境有良好的适应性,H.264(MPEG4 AVC),Copyright 2013.Shi Ping CUC,Moving Pic
25、ture Expert Group(活动图像专家组)视频及其伴音的压缩标准1988年开始研究,1992成为正式标准应用:数字存储媒体(如VCD等),交互式多媒体系统图像格式:SIF(4:2:0),逐行扫描码率:1.5Mb/s压缩方式:DCT,帧间预测编码,MPEG-1,Copyright 2013.Shi Ping CUC,活动图像及其伴音信息的通用编码1990年开始制定,1994年成为正式标准应用:SDTV,HDTV,DVD等图像格式:CCIR 601等多种格式(4:2:2,4:4:4,4:2:0),逐行扫描,隔行扫描压缩方式:DCT,帧间预测编码有多种档次:5个型,4个级与MPEG-1兼容
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数字电视 信源 编码 技术
链接地址:https://www.31ppt.com/p-6050079.html