图像通信课件第五章.ppt
《图像通信课件第五章.ppt》由会员分享,可在线阅读,更多相关《图像通信课件第五章.ppt(88页珍藏版)》请在三一办公上搜索。
1、序列图像编码及运动估计第五章,李春雷电子信息学院,目录,5.1 序列图像编码系统5.2 二维运动估计5.3 采用时间预测和变换编码的视频编码5.4 MPEG-1视频编码和解码5.5 视频图像编码标准,中原工学院电子信息学院,2,概述,数字电视、VCD、DVD、VOD、会议电视、流媒体、多媒体数据库和计算机网络等技术的日益融合和广泛应用,已经遍及国民经济和社会生活的各个方面。语音、图形、图像和数据等信息的传输、处理、存储及检索技术成为这些技术中重要的组成部分。为了能够有效地传输和存储这些信息,人们广泛采用了数字压缩编码技术。新概念、新算法、新标准、新协议正在不断涌现,这门技术已经成为当今信息与通
2、信工程学科的主要研究热点之一。,中原工学院电子信息学院,3,5.1 序列图像编码系统,视频看作一个沿时间轴分布的图像序列,统称为序列图像,其编码称为序列图像编码。如图5.1所示。对视频图像的压缩编码称为视频编码,即对构成视频的图像序列中的图像进行压缩编码。,中原工学院电子信息学院,4,5.1 序列图像编码系统,视频编码的主要目的就是在保证一定重建质量的前提下,以尽量少的数据量来表征视频信息,以减少视频序列的码率,便于能够在给定的通信信道上实时传输视频信号。传统压缩编码:以香农信息论为出发点,用统计概率模型来描述信源,这种基于数据统计的、以消除视频数据相关冗余为目的的第一代视频编码技术获得了巨大
3、成功。JPEG、MPEG-1,MPEG-2、H.261、H.263 等压缩编码国际标准,以及它们对多媒体产业的巨大影响就是有力的证明。,中原工学院电子信息学院,5,5.1 序列图像编码系统,第二代编码:第一代视频编码技术并未考虑信息接收者的主观特性、视频信息的具体含义和重要程度等,只是力图去消除数据冗余。基于内容的第二代视频编码技术,它所关心的是如何去消除视频内容的冗余,它认为人眼是视频信号的最终接收者,视频编码时应充分考虑人眼视觉特性这个因素,这是目前视频编码中最为活跃的一个领域。,中原工学院电子信息学院,6,5.1 序列图像编码系统,5.1.1 视频图像压缩的必要性 对一帧NTSC 制式的
4、彩色视频图像进行数字化传输(图像数字化成720480,颜色分量中的每个像素用8 bit 表示,每秒传输30 帧),信道的传输能力要达到约248 Mb/s。一帧HDTV 的彩色电视图像,其分辨率为1920 1080,每种颜色分量中的每个像素用8 bit 表示,每秒传输30 帧,那么信道的传输速率为1.4 Gb/s。因此,不进行视频图像的压缩将对存储器的存储容量、传输信道的传输率(带宽)及计算机的处理速度等方面造成极大的压力。为了解决这些问题,对视频图像进行压缩编码就显得十分必要和迫切了。,中原工学院电子信息学院,7,5.1 序列图像编码系统,5.1.2 视频图像编码系统的一般结构 图5.2给出了
5、一个视频编码系统的基本组成。在编码器中,首先用信源模型的参数描述数字化的视频序列。信源模型参数被量化成有限的符号集,量化参数取决于比特率与失真之间所期望的折衷。最后,用无损编码技术把量化参数映射成二进制码字。最终产生的比特流在通信信道上传输。解码器反向进行编码器的二进制编码和量化过程,重新得到信源模型的量化参数。然后,解码器用信源模型的量化参数利用图像合成算法恢复解码后的视频帧。,中原工学院电子信息学院,8,5.1 序列图像编码系统,中原工学院电子信息学院,9,5.1 序列图像编码系统,5.1.3 视频编码方案分类 几种视频编码算法,它们相应的信源模型中(见表5.1)。信源模型可做出图像序列的
6、像素之间在时间和空间上相关性的假设,也可考虑物体的形状和运动或照度的影响,一个编码算法的信源模型要根据其编码参数集和图像合成算法确定,中原工学院电子信息学院,10,5.1 序列图像编码系统,1.基于波形的编码 把像素假设为统计上独立的,得到的模型是最简单的信源模型(见表5.1)。相关的编码技术就称为脉冲编码调制(PCM)。图像信号的PCM 表示通常不用于视频编码,因为它与其它信源模型相比效率较低。大多数图像邻近像素的颜色、色度存在较高的相关性.为了减少编码比特率,使用K-L 变换、DCT 变换或小波变换等去除原图像像索点间的相关性,并把原始信号的能量集中到少数的几个系数上。需要量化和编码的参数
7、是变换系数.利用相邻样点间相关性的另一种方法是预测编码,先由前面编码的样点预测要编码的样点值,然后对预测误差进行量化和编码。,中原工学院电子信息学院,11,5.1 序列图像编码系统,现在使用的视频编码标准如H.261、H.263、MPEG-l、MPEG-2 和MPEG-4等都采用了基于块的混合编码的编码方法,它综合了预测编码和变换编码。2.基于内容的编码 基于块编码的缺点:采用固定大小的方块来近似场景中物体的形状,如果这些边界块中包含了具有不同运动的两种物体,那么用一个运动矢量就不能说明两个不同的运动,存在误差。基于内容的编码器企图把视频帧分成对应于不同物体的区域,并分别编码这些物体,对于每个
8、物体,除了运动和纹理信息外,还必须传送形状信息。,中原工学院电子信息学院,12,5.1 序列图像编码系统,二维轮廓描述物体的形状:采用分割算法运动矢量场描述物体的运动:采用运动估计颜色波形描述物体的纹理:采用纹理提取算法 在视频序列中的物体已知的情况下,可采用基于知识的编码,该编码使用特别设计的线框来描述已识别出的物体类型。因为它自适应于物体的形状,有时也把这种技术称为基于模型的编码。已知可能的物体类型和它们的行为时,可以用语义基编码。,中原工学院电子信息学院,13,5.2 二维运动估计,为什么需要二维运动估计?在视频压缩的应用中,根据估计出的运动矢量和前一个已编码的参考帧,可以得到当前帧的运
9、动补偿预测。运动估计最终要达到的目的是使编码运动矢量和预测误差所用的总的比特数最少。我们可以在运动估计的准确性与表示运动参数所用的比特数之间做出折衷的选择。在某些情况下,虽然估计的运动并不是精确的实际物体运动,但仍可以产生好的运动预测。,中原工学院电子信息学院,14,5.2 二维运动估计,5.2.1 二维运动估计的基本概念 二维运动估计既是迈向三维运动分析的第一步,也是运动补偿滤波和压缩的主要部分。运动估计算法都是基于图像亮度的时间变化,把观测到的或表现出来的二维运动矢量的速度称为光流。1.二维运动相关概念 二维运动(也称为投影运动)指的是三维运动在图像平面上的透视或正交投影。三维运动的特征可
10、依据物体像素的三维瞬时速度或三维位移来表征,二维位移和速度场分别是三维场在图像平面上的投影。,中原工学院电子信息学院,15,5.2 二维运动估计,“视在二维位移场”和“视在二维速度场”不同于投影产生的二维位移(速度)场,因为:(1)实际视频信号缺乏足够的空间图像梯度。在实际运动能被观察到的运动范围内要有足够的灰皮等级(颜色变化,才能产生光流,否则光流就不可观测.(2)外部光照的变化。一个可观测到的光流,可能由于光照引起,即使没有运动,光流亦可观察到。二维位移和速度场分别是三维场在图像平面上的投影。而对应场和光流场是由时变亮度图像特性得到的位移和速度函数。实际应用中,由于只能观察到光流场和对应场
11、,所以在本章中假设它们等同于二维运动场。,中原工学院电子信息学院,16,5.2 二维运动估计,中原工学院电子信息学院,17,5.2 二维运动估计,中原工学院电子信息学院,18,5.2 二维运动估计,中原工学院电子信息学院,19,5.2 二维运动估计,人类视觉对图像中的静止部分有较高的分辨率,必须给予充分的空间分辨率。在传输静止图像或序列图像的静止部分时,要保证较高的水平和垂直分辨率,但此时可以减少传输帧数。在接收端依靠帧存储器把未传输的帧补充出来。人类视觉对序列图像中运动物体的分辨率将随着运动物体速率的增大而显著降低。物体的运动速度越高,就可用更低的清晰度进行传输。例如,可以对序列图像中的静止
12、部分每两帧传输一次,而对运动部分采用2:1的亚抽样,这样就降低了空间分辨率,而且对视觉来说,不易觉察出收端的复原图像的质量有较明显的降低。,中原工学院电子信息学院,20,5.2 二维运动估计,中原工学院电子信息学院,21,5.2 二维运动估计,中原工学院电子信息学院,22,5.2 二维运动估计,5.2.3 运动估计与补偿的基本概念 采用帧间预测编码可以减少时间域上的冗余度,提高压缩比。静止图像:效果较好;运动图像:效果较差。对当前帧某像素(或像素块)进行预测时知道这个像素(或像素块)是从前一帧的哪个位置移动过来的,则在做预测时以真实对应位置上的像素值作为预测值,这样预测的准确性将大大提高。采用
13、运动补偿帧间预测技术,可以更好地利用序列图像的时间冗余度,使预测差值的方差大大减小,从而降低误码率,提高压缩比。获得好的运动补偿的关键是运动估计。,中原工学院电子信息学院,23,5.2 二维运动估计,1.运动估计 将图像分成若干个块,并检测出当前帧中的每个块在前一帧(参考帧)图像中的对应位置,这个过程叫做运动估计。运动估计常以宏块为单位进行,计算被压缩图像与参考图像在对应位置上的宏块间的位置偏移。这种由运动估计得到的位置偏移是以运动矢量来描述的,水平和垂直位移。,中原工学院电子信息学院,24,5.2 二维运动估计,2.运动补偿运动估计及补偿的基本原理:利用帧间运动估计得到待编码图像块的一个(或
14、多个)参考块,然后用这个参考块进行运动补偿,将补偿后的残差进行DCT 变换和可变长编码。从原理上讲,运动补偿帧间预测编码包括以下4 个部分:(1)物体划分。静止区域和运动区域,运动补偿预测编码主要是针对运动区域进行编码。(2)运动估计。对运动物体进行位移估计,找出运动矢量。(3)运动补偿。建立同一物体在不同帧的空间对应关系。(4)预测编码。对补偿后的物体的位移帧差信号进行DCT 变换、量化、编码。,中原工学院电子信息学院,25,5.2 二维运动估计,图5.9表示了帧间运动估计与补偿预测的基本过程:,中原工学院电子信息学院,26,5.2 二维运动估计,5.2.4 基于块的运动估计-匹配算法 1.
15、基本思想及研究现状 将图像序列的每一帧分成固定大小的宏块,然后对于当前帧中的每一块根据一定的匹配准则在参考帧某一给定搜索范围内找出与当前块最相似的块,即匹配块,由匹配块与当前块的相对位置计算出运动位移,所得运动位移即为当前块的运动矢量。运动估计越准确,补偿的残差就越小,编码的效率也就越高,解码出的图像质量越好。但这种运动估计在整个系统中的计算复杂度很大,往往占整个系统的50%以上。,中原工学院电子信息学院,27,5.2 二维运动估计,全搜索法:搜索精度最高,然而计算复杂度太高。改进快速运动估计算法:三步法、二维对数法、交叉法等,通过限制搜索位置的数目来减少计算量;动态搜索窗调整法是根据当前结果
16、动态调整下一步搜索步长的大小,算法性能在一定程度上有了改进 预测搜索法、自适应运动跟踪法等利用相邻块的运动相关性选择一个反映当前运动块趋势的预测点作为初始搜索点,以提高搜索速度和预测的准确性;1999年10月,菱形法被MPEG-4国际标准采纳并收入验证模型,并相继出现了正方形菱形法、线性菱形并行搜索法。,中原工学院电子信息学院,28,5.2 二维运动估计,2.提高搜索效率的主要技术 块匹配的基本思想是依据一定的匹配法则,通过在两帧之间的像素域利用搜索程序找到最佳的运动矢量估计。,中原工学院电子信息学院,29,5.2 二维运动估计,运动估计算法的整体效率主要体现在图像质量、压缩码率和搜索速度(复
17、杂度)三个方面。运动估计越准确,预测补偿的图像质量越高;补偿的残差就越小,编码所需位数也就越少;运动估计速度越快,越有利于实时应用。提高图像质量,加快估计速度,减小比特率等都是运动估计算法的研究目标。通常是通过研究初始搜索点的选择、匹配准则和运动搜索策略等来提高算法效率。1)初始搜索点的选择(1)直接选择参考帧对应块的中心位置。(2)选择预测的起点。,中原工学院电子信息学院,30,5.2 二维运动估计,2)块匹配准则 运动估计算法中常用的匹配准则有三种:最小绝对值差(MAD)、最小均方误差(MSE)和归一化互相关函数(NCCF)。3)搜索策略 搜索策略选择恰当与否对运动估计的准确性、运动估计的
18、速度都有很大的影响。有关搜索策略的研究主要是解决运动估计中存在的计算复杂度和搜索精度这一矛盾。,中原工学院电子信息学院,31,5.2 二维运动估计,3 典型的块匹配算法1)全搜索法(FS,Full Search method)(1)算法思想:全搜索法也称为穷尽搜索法,是对搜索范围内所有可能的候选位置计算其SAD(i,j)值,从中找出最小SAD,其对应偏移量即为所求运动矢量。此算法计算量虽大,但最简单、可靠,找到的一定是全局的最优点。(2)算法描述:Step1 从原点出发,按顺时针方向由近及远,在每个像素处计算SAD 值,直到遍历搜索范围内的所有点。Step2 在所有的SAD中找到最小块误差(M
19、BD)点,该点所在位置即对应最佳运动矢量。,中原工学院电子信息学院,32,5.2 二维运动估计,2)二维对数法(TDL,Two-Dimensional Logarithmic)二维对数搜索法由J.R.Jai n 和A.K.Jain 提出,它开创了快速算法的先例,分多个阶段搜索,逐次减小搜索范围直到不能再小时才结束。(1)基本思想:二维对数法是从原点开始,以“十”字形分布的五个点构成每次搜索的点群,通过快速搜索跟踪MBD 点。(2)算法描述:Step1 从原点开始,选取一定的步长,在以十字形分布的五个点处进行块匹配计算并比较。,中原工学院电子信息学院,33,5.2 二维运动估计,中原工学院电子信
20、息学院,34,5.3 采用时间预测和变换编码的视频编码,5.3.1 三种常用的视频帧 典型的视频压缩技术是将第一帧图像按照静态图像编码,接着确定出前一帧与当前帧的差值,通过对这些差值进行编码来得到后续帧图像的编码。如果当前帧图像与前一帧图像区别很大,应该独立于其它帧图像对其迸行单独编码。在视频压缩中,常使用三种视频帧,其关系见图5.23 所示.,中原工学院电子信息学院,35,5.3 采用时间预测和变换编码的视频编码,l.帧内图像 帧内图像(Intra Frame 或Intra)也称I帧图像,是不考虑与其它图像帧的关系而单独进行编码的图像,它不需要任何其它的帧图像来进行预测编码。帧内视频图像的编
21、码是通过减少视频空间冗余度来完成压缩的,它们也提供了数据流的起始解码数据指针.2.前向预测图像 前向预测图像(Predicted Pictures)也称P帧图像,是根据前面已编码的I图像或P图像进行编码的图像,它利用运动补偿技术完成编码,并且还可以为下一非I帧图像提供运动预测,通过降低空间和时间上的冗余度。,中原工学院电子信息学院,36,5.3 采用时间预测和变换编码的视频编码,3.双向预测图像 双向预测图像(Bidirectional Prediction Pictures)也称B 帧图像,是同时根据前面的I图像和后面的P 图像(或前后两个P 图像)进行编码的图像。它也是利用运动补偿技术完成
22、编码,其压缩效率最佳。为了能实现利用下一帧图像进行后向预测,编码器要对视频帧重新排序,视频帧的顺序编排将由原来的播放画面顺序改变成视频传送顺序。利用前一帧对当前帧进行编码将引入失真,导致直到下一帧内图像出现前的所有图像解码都不准确,要求除对第一帧进行帧内编码,还须在图像序列中间不时采用帧内编码。,中原工学院电子信息学院,37,5.3 采用时间预测和变换编码的视频编码,图5.24(a)是这三种图像构成的一个图像序列,以编码器输入的顺序排列。图5.24(b)是以解码器的输出和显示的顺序排序的同一图像序列。每一帧图像都要有两个时间标记,一个表示编码顺序,一个表示显示顺序。,中原工学院电子信息学院,3
23、8,5.3 采用时间预测和变换编码的视频编码,5.3.2 基于块的混合视频编码 每个视频帧被分成固定大小的块,对每个块独立地进行处理,称为基于块的。混合意味着每个块是联合运用运动补偿时间预测和变换编码进行编码的。图5.25 给出了这种编码范例中的关键步骤。首先,利用基于块的运动估计由前面已编码的参考帧对块进行预测,运动矢量确定当前块和最佳匹配块之间的位移,得到预测误差。然后,用DCT 对预测误差块进行变换,量化DCT 系数,并用可变长编码把它们转换成二进制码字。,中原工学院电子信息学院,39,5.3 采用时间预测和变换编码的视频编码,实际用于运动估计的块大小可能与用于变换编码块的大小不一样。运
24、动估计是在一个较大的块,称为宏块(MB.Macro Block)上进行的,宏块被进一步分成几个块,对这些块求DCT 的值.例如,在大多数视频编码标准中,宏块的大小是1616个像素,而每个块的大小是8 8 个像素。在MPEG-1和MPEG-2标准中,把帧划分成图像组(GOP.group of pictures)。而每个图像组以I 帧开始,后跟交织的P 帧和B帧。这使随机访问成为可能,可以访问任何图像组而不需要对前面的图像组进行解码。图像组结构也允许快进和快倒,仅解码I帧或解码I帧和P帧就可以实现快进。以后的顺序仅解码I 帧就可以实现快倒。,中原工学院电子信息学院,40,5.4 MPEG-l 视频
25、编码和解码,5.4.1 MPEG-1介绍 MPEG 是活动图像专家组(Moving Picture Expert Group)的缩写。MPEG 是一种视频压缩方法,包括对数字图像、声音以及两者同步信号的压缩。MPEG-1是针对数据率大约为1.5 Mb/s 的中等数据率情况的标准。MPEG-2主要针对的是10 Mb/s 的高数据率的标准。MPEG-3起初为HDTV 压缩而设计,但后来发现是多余的,于是将其归并到MPEG-2中去。MPEG-4主要针对的是码率低于64 kb/s 的甚低数据率的情况。本节主要针对MPEG-1的图像压缩方法进行讨论。,中原工学院电子信息学院,41,5.4 MPEG-l
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 图像 通信 课件 第五
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-6222948.html