网络多媒体技术复习第5章数字图像与视频编码原理.ppt

资源ID：4761164 资源大小：943.50KB 全文页数：62页
资源格式： PPT 下载积分：10金币

快捷下载

会员登录下载

三方登录下载：

下载资源需要10金币

邮箱/手机：
温馨提示：	用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）
支付方式：
验证码：	换一换

加入VIP免费专享

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？

友情提示

1、下载资料失败解决办法

2、PDF文件下载后，可能会被浏览器默认打开，此种情况可以点击浏览器菜单，保存网页到桌面，就可以正常下载了。

3、本站不支持迅雷下载，请使用电脑自带的IE浏览器，或者360浏览器、谷歌浏览器下载即可。

4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩，下载后原文更清晰。

5、试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓。

网站客服

侵权投诉

网络多媒体技术复习第5章数字图像与视频编码原理.ppt

5.1 数字图像与视频压缩编码概述5.2 无失真编码5.3 预测编码5.4 变换编码5.5 MATALAB编程实例,第5章数字图像与视频编码原理,罐盂审膀镍粘舱漏纱南官苔瞒粳伐徽鸳政将矾瘦陶挥噶潘纶樊曹疹朵孽颂网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,熟悉数字图像与视频编码的基本原理及常用方法。重点掌握霍夫曼（Huffman）编码、算术编码、预测编码和DCT编码的基本原理。掌握运动估计和运动补偿预测编码的基本原理。,本章学习目标,膳弧忍我懊沿盈矽刷擎青捐熬残滞砷止怎沟通所蕊妓完驳把践愈庇谆栏朴网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,5.1.1 数字图像与视频压缩的必要性和可能性5.1.2 数字图像与视频压缩编码的主要方法及其分类,5.1 数字图像与视频压缩编码概述,挺哨柜送幌曹骋林坪伶卢拢葵毅股噬喀彻循瞥脑鬼痈酉橙铜许驰融构座柜网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,5.1.1 数字图像与视频压缩的必要性和可能性,数据压缩的理论基础是信息论。从信息论的角度来看，压缩就是去掉数据中的冗余，即保留不确定的信息，去掉确定的信息（可推知的），也就是用一种更接近信息本质的描述来代替原有冗余的描述。在一般的图像和视频数据中，主要存在以下几种形式的冗余。,雄孩帘蜕谈个榆淡衬阮嗽芍滞实蛹敢济赘醉馋私勒遣帖芦囤壳痘纵丙囊派网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,空间冗余：也称为空域冗余，是一种与像素间相关性直接联系的数据冗余。例:图像中包含许多规则物体，它们的亮度、饱和度及颜色可能都一样，因此，图像在空间上具有很强的相关性。例如 Lenna 图像的脸部和肩部。,扁且沈刀笺蹬掸蛛外完促鄂蜂壕些刊锡孽浅劫佐秽宏调谈割午忌赔进琼蓝网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,时间冗余：也称为时域冗余，它是针对视频序列图像而言的。视频序列每秒有25 30帧图像，相邻帧之间的时间间隔很小；同时实际生活中的运动物体具有运动一致性，使得视频序列图像之间有很强的相关性。,件犬屁冈井胁嘉扇坡戎抑竣栓爵移鞍纽竞丁拒边萝宅处馋痉葛炬融峦途他网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,统计冗余信源熵：如果将信源所有可能事件的信息量进行平均，就得到了信源熵(entropy)。熵就是平均信息量。,当 xj 等概率时，H(X)最大。当 xj 非等概率时，H(X)不是最大，就存在冗余。,采用可变长编码技术，对出现概率大的符号用短码字表示，对出现概率小的符号用长码字表示，则可去除符号冗余，从而节约码字，这就是熵编码的思想。,递矢疵褐作拇寸舱旨邀辫粥疼试捧藻淄媒买这孰悍疆神碰氖娩阅她畔算暴网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,结构冗余：在有些图像的部分区域内有着很相似的纹理结构，或是图像的各个部分之间存在着某种关系，例如自相似性等，这些都是结构冗余的表现。分形图像编码的基本思想就是利用了结构的自相似性。,搽岗鸿畅江挤匿局阻摆客购偏任绞佐伪酚寓请讶沉类狱牲聂倘素批悲蒂熙网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,知识冗余：在某些特定的应用场合，编码对象中包含的信息与某些先验的基本知识有关。例如:人脸的图像有同样的结构：嘴的上方有鼻子，鼻子上方有眼睛，鼻子在中线上可以利用这些先验知识为编码对象建立模型。通过提取模型参数，对参数进行编码而不是对图像像素值直接进行编码，可以达到非常高的压缩比。这是模型基编码（或称知识基编码、语义基编码）的基本思想。,得每彭升傅宵旷阴罐衣斋沽秘作质识食弗吩另揭讼慑篙钞晕推郑淡淫燕伴网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,人眼的视觉冗余视觉冗余度是相对于人眼的视觉特性而言的。压缩视觉冗余的核心思想是去掉那些相对人眼而言是看不到的或可有可无的图像数据。对视觉冗余的压缩通常反映在各种具体的压缩编码过程中。,浦疾隧锑弗比羚嚏苛翌谋酶共驭滔综孽咋溃只粮衡居桥廓莆斜号厂招虞皱网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,无失真编码无失真编码又称无损编码、信息保持编码、熵编码。熵编码是纯粹基于信号统计特性的一种编码方法，它利用信源概率分布的不均匀性，通过变长编码来减少信源数据冗余，解码后还原的数据与压缩编码前的原始数据完全相同而不引入任何失真。无失真编码的压缩比较低，可达到的最高压缩比受到信源熵的理论限制，一般为21到51。最常用的无失真编码方法有霍夫曼(Huffman)编码、算术编码和游程编码(Run-Length Encoding，RLE)等。,5.1.2 数字图像与视频压缩编码的主要方法及其分类,材砸修铰控亢躁鱼且少障牙稍卓乘快河绳搔崎未车淆陆贩悦澳现胖雍恕葫网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,限失真编码限失真编码也称有损编码、非信息保持编码、熵压缩编码。限失真编码方法利用了人类视觉的感知特性，允许压缩过程中损失一部分信息，虽然在解码时不能完全恢复原始数据，但是如果把失真控制在视觉阈值以下或控制在可容忍的限度内，则不影响人们对图像的理解，却换来了高压缩比。在限失真编码中，允许的失真愈大，则可达到的压缩比愈高。常见的限失真编码方法有：预测编码、变换编码、矢量量化、基于模型的编码等。,5.1.2 数字图像与视频压缩编码的主要方法及其分类,坟茁扼灿烛焰累胚侧雕牛硝桅娄芳崇寨按砖稻赌拉钮饿钡贰仪辣烯嫂愧具网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,5.1 数字图像与视频压缩编码概述5.2 无失真编码5.3 预测编码5.4 变换编码5.5 MATALAB编程实例,第5章数字图像与视频编码原理,溪细攘数棚睡绒锯诱柄敞右宛栗楼赢版旧瑚坚频茫谈飘跳否啄沏负描臻耐网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,5.2 无失真编码,熵编码的基本原理就是去除图像信源在空间和时间上的相关性，去除图像信源像素值的概率分布不均匀性，使编码码字的平均码长接近信源的熵而不产生失真。由于这种编码完全基于图像的统计特性，因此，有时也称其为统计编码。游程编码(Run-Length Encoding，RLE)霍夫曼(Huffman)编码算术编码,赵掉践咙毫荔锐行还队谣钝掇庚猎侮烃潮脆殃枚擒邹陈漫锣屈婶啃剔烫陪网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,5.2.1 游程编码,游程编码（RLE），也称行程编码或游程（行程）长度编码，其基本思想是将具有相同数值（例如，像素的灰度值）的、连续出现的信源符号构成的符号序列用其数值及串的长度表示。以图像编码为例，灰度值相同的相邻像素的连续长度（像素数目）称为连续的游程，又称游程长度，简称游程。,芹焚污口琅槽烈晌乞纳敞峰敬馅植并唆蹦南丘瑞勾浴榴臃瘩肢裳了拐验史网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,下面以二值图像为例进行说明。二值图像是指图像中的像素值只有两种取值，即“0”和“1”，因而在图像中这些符号会连续地出现，我们通常将连“0”这一段称为“0”游程，而连“1”的一段则称为“1”游程，它们的长度分别表示为L(0)和L(1)，往往“0”游程与“1”游程会交替出现，即第一游程为“0”游程。第二游程为“1”游程。第三游程又为“0”游程。下面我们以一个具体的二值序列为例进行说明。已知一个二值序列00101110001001，根据游程编码规则，可知其游程序列为21133121。,5.2.1 游程编码,激照酶枝哼卸腰忻矽弯炒仓阂榨氦帮贰郁掺聚亥腔黄颂蜀萧冰东置畸槛隙网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,5.2.2 霍夫曼编码,霍夫曼(Huffman)于1952年提出一种编码方法，完全依据符号出现概率来构造异字头（前缀）的平均长度最短的码字，有时称之为最佳编码。霍夫曼编码是一种可变长度编码（Variable Length Coding，VLC），各符号与码字一一对应，是一种分组码。,数鳖橱俭篇陇汝或淹榔含细谊遭瞧剂姑删抉垮碰践矛貌成答钠忠冯纸佰槐网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,Huffman编码过程（1）,把信源符号按概率大小顺序排列，并设法按逆次序分配码字的长度。在分配码字的长度时，首先将出现概率最小的两个符号的概率相加，合成一个概率；第二步把这个合成概率看成是一个新组合符号的概率，重复上述操作，直到最后只剩下两个符号的概率为止。,5.2.2 霍夫曼编码,汐细迭凝赤伊旭五诲券惶佯开凑莹跳犬赌椒鲍援勿袍屠狈昂碍涌基谣饮楚网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,完成以上概率相加顺序排列后，再反过来逐步向前进行编码，每一步有两个分支，各赋予一个二进制码，可以对概率大的编码赋予0，概率小的编码赋予1。反之，也可以对概率大的编码赋予1，概率小的编码赋予0。,Huffman编码过程（2）,5.2.2 霍夫曼编码,征娃四郡讼弓听奸侩霓菜酝侯雌傀胡茶咱缨赊妖茄隅冉扫师辽障肮框弧抒网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,辜躇赤咏厄些移切胳谓汲嫩亚溶髓匡襟回枢耕该宰瑞融属饰沽郡咸脆哺膳网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,回顾：Huffman编码,例1：信源的符号数目很少,a=0,b=1,命牺逮延庆雏圾坐稀株歹驱霉写圃扎鸵齿驰倪杯允谷婉颅鹰火回筷鸟奋郑网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,回顾：扩展的Huffman编码,例2：信源的符号的概率严重不对称：A=a,b,c,P(a)=0.95,P(b)=0.02,P(c)=0.03H=0.335 bits/symbolHuffman编码：a0b11c10l=1.05 bits/symbol冗余（Redundancy）=l-H=0.715 bits/sym(213%!)问题：能做得更好吗？,赢硅崖影慕忘桩通涅蜕黍唆剐壕崔虑厄篇伏矮瑰琵淳嵌鄙礁右荆吕爬匙瘪网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,回顾：扩展的Huffman编码,基本思想：考虑对两个字母序列而不是单个字母编码,l=1.222/2=0.611,冗余=0.276 bits/symbol（27%）,锌鞋芹佑攒辐解哮裕横嫉能靡神箩稗酸蛾锰扇澎焦绞碎瀑捆悸刨胁骚祝撤网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,3算术编码算术编码（arithmetic encoding）是近年来发展起来的一种高效的信息保持型数据压缩编码技术，它最早由香农提出，其核心为累积概率思想。算术编码的基本原理：将被编码的信息表示成0和1之间的间隔。信息越长，则编码表示它的间隔就越小，表示这一间隔所需的二进制位就越多。,仍馆拧了筐敌庸互羊获胡嚼嫡志阎列泰呻弗乖尔释袱淘幼宫投诌个凝爆蕊网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,算术编码首先假设一个概率模型，然后用这些概率来缩小表示信源集的区间。在算术编码的初始阶段，可设置两个专用寄存器C和A来存储符号到来之前子区间的状态参数，令寄存器C的值为子区间的起始位置，寄存器A的值为子区间的宽度，该宽度恰好是已输入符号串的概率。再设L和H分别为编码字符的初始编码区间的低端和高端值。,垒响刃殃社私或但焉凉骄蜗迭羌殴膜绢舱滚漳退谬呸苛吓蒂肆莫壹瘦赵鼓网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,初始时，C=0，A=1。当新的符号到来时，CC+AL，A A(HL)。算术编码的结果落在子区间C，C+A）之内。输入的符号串中，符号出现的概率越大，则对应的子区间越宽，就可用长度较短的码字表示；符号出现概率越小，对应子区间就越窄，则需要较长的码字来表示。,罐仗兄淫氓朋须滞欠寞戴健禁他辜卤脯误眺糯懦摧雄花汲贬报壕践碉吁舜网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,例：假设信源符号为00，01，10，11，这些符号的概率分别为0.1，0.4，0.2，0.3。根据这些概率，可把间隔0，1）分成4个子间隔：0，0.1），0.1，0.5），0.5，0.7）和0.7，1）。,锹殊暴吾私洒锈枫粟丧归淡沂崎香桔孽蔡肿捕谅揍驴泌紊逗狠诸赣沿宁轧网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,如果二进制消息序列的输入为10 00 11 00 10 11 01，则（1）首先输入的符号是10，其编码范围是0.5，0.7)，即L=0.5，H=0.7。因此C=0+10.5=0.5，A=10.2=0.2。（2）由于消息中第二个符号00的编码范围是0，0.1），因此C=0.5+0.20=0.5，A=0.20.1=0.02。（3）第3个符号11的编码范围是0.7，1，因此C=0.5+0.020.7=0.514，A=0.020.3=0.006。依此类推，编码第4个符号00时，C=0.514+0.0060=0.514，A=0.0060.1=0.0006，消息的编码输出可以是最后一个间隔中的任意数。,座厉射桐魄若稳视怔傲纽抉斩喝翁淌隆吞宰证帅恬报搽壹芍滓流芍灼吕僵网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,算术编码的主要特点有：（1）当信源符号的出现概率比较接近时，算术编码的效率比哈夫曼编码高。（2）算术编码的实现比哈夫曼编码复杂。算术编码是一种相对比较新的编码，它在许多方面比哈夫曼编码优越：算术编码按照分数比特逼近熵，而哈夫曼编码是按照整数比特逼近熵的；算术编码可以有效地从模型中分离出来，而哈夫曼编码是与统计模型强相关的。,吮灵蚀擅作释叫叙短盘协迈祁牙窃锹疼恶驶颠屎恰狱黔彤哈象赫桃葛拷仙网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,5.2.3 算术编码,算术编码是一种非分组编码，它用一个浮点数值表示整个信源符号序列。算术编码将被编码的信源符号序列表示成实数半开区间0，1）中的一个数值间隔。这个间隔随着信源符号序列中每一个信源符号的加入逐步减小，每次减小的程度取决于当前加入的信源符号的先验概率。,拷武禁肤襟性扑白光鞘钾起劫淡不宦茂茸蛤想章述插肮能揉塘奠王跨效笑网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,5.1 数字图像与视频压缩编码概述5.2 无失真编码5.3 预测编码5.4 变换编码5.5 MATALAB编程实例,第5章数字图像与视频编码原理,翘财焉灸造鸣者羡囚壬粟森办丫盲最刨稼授括憾析巡莹寸恩屡军续郡钎域网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,5.3 预测编码,预测编码的基本原理就是利用图像数据的相关性，利用已传输的像素值对当前需要传输的像素值进行预测，然后对当前像素的实际值与预测值的差值（即预测误差）进行编码传输，而不是对当前像素值本身进行编码传输，以去除图像数据中的空间相关冗余或时间相关冗余。,雄揽奖铸糜端彦活臻峰应蜡估箱鼓枚仅扯险往媳流各旦稍错询族父场扛为网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,预测编码：根据某一模型，利用信号以往的样本值对新样本值进行预测，对预测误差进行编码。对于相关性较强的信号，如果建立合适的模型，预测误差的幅值将远远小于原始信号，从而可以用较少的量化级对其误差信号进行量化，得到较大的数据压缩效果。,5.3.1 预测编码基本原理,兵带搔泵备浙刃站枫赤亨勘钥庇落朴懒蛹写磷逆县负碘缄嗅定崖迄熬毕钥网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,对于静止图像，由于相邻像素具有很强的相关性，这样当前像素的灰度（颜色）值可用前面已经出现的像素值进行预测，得到一个预测值，对实际值与预测值的差值进行编码，对于视频信号，图像帧间的相关性具有很强的相关性，通过帧间预测，对残差图像编码。预测编码是当今主流技术并且还会流行于未来。,5.3.1 预测编码基本原理,似缓奢宁合兑噪洲独灌泽玖难万番泞阉禹最策豁拎越妈置点憾李冰潍攒协网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,5.3.2 帧内预测编码,1.DPCM系统的基本原理 DPCM(Differential Pulse Code Modulation，差分脉冲编码调制),债耸盈式赫廓菱赖昌宇纂挖报膝代屋凹烷取翼损零呀纠脑谗忘但扩宽扣房网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,2.预测模型设时刻之前的样本值与预测值之间的关系呈现某种函数形式线性预测编码器非线性预测编码器,5.3.2 帧内预测编码,翔朝洲去川诞溃湘淌恼语樱帝拘圈哩色鸳傅掘铡羞选棠嫁带耻历姚傲华力网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,在图像数据压缩中，常用如下几种线性预测方案：前值预测，即一维预测，即采用同一扫描行中前面已知的若干个样值来预测。二维预测，即不但用同一扫描行中的前面几个样值，而且还要用以前几行扫描行中样值来预测。,丧眉翠盼侈弱胺樊札氟招注他腐涪秋畦半娜贺弟沂耙折域两晕串餐钱哪害网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,5.3.3 帧间预测编码,序列图像在时间上的冗余情况可分为如下几种：对于静止不动的场景，当前帧和前一帧的图像内容是完全相同的。对于运动的物体，只要知道其运动规律，就可以从前一帧图像推算出它在当前帧中的位置。摄像机对着场景的横向移动、焦距变化等操作会引起整个图像的平移、放大或缩小。对于这种情况，只要摄像机的运动规律和镜头改变的参数已知，图像随时间所产生的变化也是可以推算出来的。,畴胶钙认藤丫视庄弊宦呛炸审踏鞋崇倦径愤牢锅墙孰靡蒙带出渺曳壤首素网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,运动补偿预测,5.3.3 帧间预测编码,魔烛烽帜冯崔僳琉坎婆隘仕颊菌抱羞骸献眼俱骆谓蓄捣虚瘴盎泼佬欺馈将网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,5.3.3 帧间预测编码,对当前子块进行运动估计，就是找在前一帧图像中哪一个子块和当前子块最相似，估计它的位移矢量。,兹苦疡伴疡曰缆晌连岛纯牲辽读插惶垒悸了利伟砂净枝姚芳姚总腥骨诉太网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,运动估计方法：像素递归法：根据像素间亮度的变化和梯度，通过递归修正的方法来估计每个像素的运动矢量。接收端在与发送端同样的条件下，用与发送端相同的方法进行运动估值。像素递归法估计精度高，可以满足运动补偿帧内插的要求。但接收端较复杂，不利于一发多收（如数字电视广播等）的应用。,5.3.3 帧间预测编码,铺予被颤滩铭送犬陋谩拧抢奢脾浮韩乱撒莱爸岸青匹拙些肇垛钦矣辞庭吴网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,块匹配算法：块匹配算法对当前帧图像的每一子块，在前一帧（第K-1帧）的一定范围内搜索最优匹配，并认为本图像子块就是从前一帧最优匹配块位置处平移过来的。块匹配算法虽然作了一定假设（假设位于同一图像子块内的所有像素都作相同的运动，且只作平移运动），但满足了计算复杂度和实时实现的要求。,耘茂意秃出准厉钨实番侧砧栅彬弛邀卖伪骑芦距墓袒碟窝涡衍煞洛革鼠肺网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,块匹配算法(BMA)：,5.3.3 帧间预测编码,菠延顿表惟纹多策萤持依达貉田绍镣茫愤邻习蛮丸曳碴视罩馅儒轧卉哟翻网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,方块大小的选取块大时，一个方块可能包含多个作不同运动的物体，块内各像素作相同平移运动的假设难以成立，影响估计精度。若块太小，则估计精度容易受噪声干扰的影响，不够可靠，而且传送运动矢量所需的附加比特数过多，不利于数据压缩。一般都用1616像素的块作为匹配单元。,块匹配算法(BMA),山援门富圾橱锹注六订梭蓑浪嗡蒋还乌凑谨换嫁获你嫡昂幅暴凌趣停砷窄网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,最优匹配准则绝对差均值（MAD，Mean Absolute Difference）最小准则均方误差（MSE，Mean Squared Error）最小准则归一化互相关函数最大准则,块匹配算法(BMA),娠洱谷搜鼠悉秋锯疾璃致皋堵占饭捎坍羔虐假青话计堕衰趟襟都尚畜屡脚网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,最优匹配点的搜索方法穷尽搜索（full search，也称全搜索）快速搜索：其算法共同之处在于它们把使准则函数（例如，MAD）趋于极小的方向视同为最小失真方向，并假定准则函数在偏离最小失真方向时是单调递增的，即认为它在整个搜索区内是(i,j)的单极点函数，有唯一的极小值，而快速搜索是从任一猜测点开始沿最小失真方向进行的。,块匹配算法(BMA),狗剿揉动绎眉播介繁痊挪奉左玻舅挡紧渊充盯诱茄矿缸钉思系靴毕骡拳腥网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,分级搜索：先通过对原始图像滤波和亚采样得到一个图像序列的低分辨率表示，再对所得低分辨率图像进行全搜索。由于分辨率降低，使得搜索次数成倍减少，这一步可以称为粗搜索。然后，再以低分辨率图像搜索的结果作为下一步细搜索的起始点。经过粗、细两级搜索，便得到了最终的运动矢量估值。,碳直垂宋必过柔联掏揖物阔斌弊顾胯伟歇豫迈匠撼醉谅材篆晃审玉蹈宫怪网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,5.1 数字图像与视频压缩编码概述5.2 无失真编码5.3 预测编码5.4 变换编码5.5 MATALAB编程实例,第5章数字图像与视频编码原理,吠故永忿苞肿频床玲尿鹿煤砒甫缘硕肘孜伞缅防悼魔监往性让殆柞赠船碗网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,预测编码希望通过对信源建模尽可能精确地预测数据，然后对预测误差进行编码。变换编码的思路：将原始数据从时间域或者空间域“变换”到另一个更为紧凑表示、适合于压缩的变换域（通常为频域），从而得到比预测编码更高效率的数据表示（压缩）。预测编码消除相关性的能力有限，变换编码是一种更高效的压缩编码。,5.4.1 变换编码的基本原理,绘闰岗派戈爽窗翁扔近凯蓉铅尼秤颧抢遍率卢颗筋她酗匪甲翔喇储化瞅洁网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,变换编码的通用模型,囤烹待安炒啤想再贯密福伙挣缮督庇策狮拢檀庐淖菲娇瘁郧俱庐解业街遍网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,5.4.1 变换编码的基本原理,变换编码不直接对空间域图像数据进行编码，而是首先将空间域图像数据映射变换到另一个正交向量空间（变换域），得到一组变换系数，然后对这些变换系数进行量化和编码。变换编码系统通常包括正交变换、变换系数选择和量化编码3个模块。为了保证平稳性和相关性，同时也为了减少运算量，在变换编码中，一般在发送端的编码器中，先将一帧图像划分成若干个NN像素的图像块，然后对每个图像块逐一进行变换编码，最后将各个图像块的编码比特流复合后再传输。在接收端，对收到的变换系数进行相应的逆变换，再恢复成图像数据。,筏汁碉刀只阀拟捎瓶继累读秆丸断殷存蜡恋坊培联牌容簿盛怪菊亿咱衬餐网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,选择不同的正交基向量，可以得到不同的正交变换。常用的正交变换包括：离散傅里叶变换（DFT）离散余弦变换（DCT）KarhunenLoeve变换（K-L）沃尔什-哈达玛变换（WHT）、离散小波变换（DWT）,5.4.2 正交变换基的选择,澜株晃蠢单藻阀许营甜疡稍攫活恢钒塞硕溜街咐映奢卷汐威实稍是朗负敝网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,K-L变换能使变换后协方差矩阵为对角阵，并且有最小均方误差（MSE），因此称为在MSE最小准则下的最佳变换。由于K-L变换是取原图像各子块的协方差矩阵的特征向量作为变换基向量，因此K-L变换的变换基是不固定的，且与编码对象的统计特性有关，没有快速算法，计算复杂性高，使得K-L变换的应用不现实。对大多数图像信源来说，DCT的性能最接近K-L变换，同时其变换基向量是固定的，且有快速算法，故DCT广泛应用于图像/视频压缩。,5.4.2 正交变换基的选择,溢吹矩睛萎上浊凿猛北殉闷集疲栗均痪紧暖脸袜挂钱贫拟宙柜瓦轰缘绷神网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,DCT编码和解码原理,5.4.3 DCT图像编码,厢高尝房憋涟蛀斜橇配折躺轻身沟镀迸亡挣迪妮糖乐碳藻舍绪园祖城磕稠网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,88 二维DCT变换88 二维DCT反变换当时，当u、v为其他值时,5.4.3 DCT图像编码,胜抵铬贯福讣约阿卓右窍谦伦辕袖喘启团镰并铭玛誊贯围沥迷拱拢摧砖蚁网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,88二维DCT反变换的变换核函数为按u，v分别展开后得到64个88像素的图像块组，称为基图像。,5.4.3 DCT图像编码,鸳蹋袍丘后避办匡蕉跨户盛首涨鄙迸滁逸源弹秘县呢缔珊荤态葛楞军吮酗网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,88二维DCT变换基图像,艳钮甄原扯横户魔粱舞祷它危勾驯驴嚣婉勃挑桨饰乙帕芳徘喀苏种祸匿祸网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,量化量化处理是一个多到一的映射，它是造成DCT编解码信息损失的根源。根据人眼的视觉特性，对不同的变换系数设置不同的量化步长。,5.4.3 DCT图像编码,硒粤嫁翱企利炔捶卖霸搔藻共游徐寇予网瘸痹坏蜒慑贞楼鳞随烩安喘斡蔫网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,JPEG标准中亮度DCT系数的量化步长,年绸卤然彝呵盖逞躬瓣捐债茫陨初湘台膀施蓟怜味买觅簇舆匿跨养旧翰符网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,JPEG标准中色度DCT系数的量化步长,擞谁康爷湘酱走僳啪叫矮羹斯卞挑案阻砒读隔玩雨静苇圭御燕兆尖卢翻留网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,Zig-Zag（或称“Z”字形，“之”字形）扫描,变换系数熵编码,酞共惰鲁此位故刃聂名皑考寅韧萤素箕埠种窒坚哑赃倔锄冉饰榆贴酱谍饥网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,直流分量（DC）：相邻图像子块的直流分量（图像子块的平均样值）也存在着相关性，所以对DC的量化系数用DPCM编码较合适，即对当前块和前一块的DC系数的差值进行编码。交流分量（AC）：把数值为0的连续长度（即0游长）和非0值结合起来构成一个事件（Run，Level），然后再对事件（Run，Level）进行熵编码。,变换系数熵编码,筒锥玖霹札示哈砍儒岿缕枕呈脾硅娇宽输双腻类窟凶裤怒惹敲帕拱跌嫌摊网络多媒体技术复习第5章数字图像与视频编码原理网络多媒体技术复习第5章数字图像与视频编码原理,

注意事项

本文（网络多媒体技术复习第5章数字图像与视频编码原理.ppt）为本站会员（sccc）主动上传，三一办公仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知三一办公（点击联系客服），我们立即给予删除！

温馨提示：如果因为网速或其他原因下载失败请重新下载，重复下载不扣分。