信息论与编码第4无失真信源编码.ppt
《信息论与编码第4无失真信源编码.ppt》由会员分享,可在线阅读,更多相关《信息论与编码第4无失真信源编码.ppt(44页珍藏版)》请在三一办公上搜索。
1、第4章 无失真信源编码,前面的章节中,我们对信息问题从理论的角度进行了一些度量和分析。从本章开始,我们将讨论在信息论的基础上进行各种编码。本章主要介绍编码的基本概念,信源编码的基本思路与主要方法,以无失真、统计编码为主,期望通过本章学习能建立起信源压缩编码的基本概念。,学习得来终觉浅,绝知此事要自悟,第4章 编码类型,(1)在不失真或允许一定失真条件下,如何提高信息传输速度,这种编码称为信源编码。根据是否允许失真,信源编码又可以分为无失真信源编码(当失真可以逼近于0时,在信息论中也当做无失真编码讨论)和限失真信源编码。(2)在信道受到干扰的情况下,如何增加信号的抗干扰能力,同时又使得信息的有效
2、传输率最大,达到这种目的的编码称为信道编码。它是为了对抗信道中的噪音和衰减,通过增加冗余,如校验码等,来提高抗干扰能力以及纠错能力。,第4章 编码类型,(3)在可以监听的信道上如何进行安全的通信,使得在信道上监听的人也无法获取消息,需要进行加密。对应的加密转换方法称为加密编码。,4.1 编码器和相关概念,为了分析方便和突出问题的重点,当研究信源编码时,我们把信道编码和译码看成是信道的一部分,从而突出信源编码。同样,在研究信道编码时,可以将信源编码和译码看成是信源和信宿的一部分,从而突出信道编码。对于加密编码也是如此。简单地说,通信系统模型中的各种编码都是可选的,我们可以忽略其他编码,而专门讨论
3、我们研究的那种编码。,4.1.1 码的分类,图4-1 信源编码器模型,4.1.1 码的分类,图4-2 码的分类,4.1.1 常用码的定义,1.二元码和r元码,若码符号集为X=0;1,所有码字都是一些二元序列,则称为二元码(Binary Code)2.等长码,若一组码中所有码字的码长都相同,即li=l(i=1,2,q),则称为等长码(定长码,fixed length code)3.变长码,若一组码组中所有码字的码长各不相同,则称为变长码(variable length codes),4.1.1 常用码的定义,4.非奇异码,若一组码中所有码字都不相同,则称为非奇异码(nonsingular cod
4、e,nonsigular code)5.奇异码,若一组码中有相同的码字,则称为奇异码。该码可能具有什么用途,又有什么缺陷?6.唯一可译码7.非即时码和即时码8.分组码与非分组码,4.1.2 码树,对于给定码字的全体集合 C=W1,W2,Wq,可以用码树来描述。码树有助于研究唯一可译码的判别。,图4-3 码树图,4.1.3 Kraft不等式,利用码树可以判断给定的码是否为惟一可译码,但需要画出码树。在实际中,我们可以利用克拉夫特(又译克劳夫特,Kraft)不等式,直接根据各码字的长度来判断惟一可译码是否存在,即各码字的长度应符合克拉夫特不等式:,4.1.3 Kraft不等式,定理4-1 Kraf
5、t定理:对于码符号为X=x1,x2,xr的任意唯一可译码,其码字为W1,W2,Wq,所对应的码长为l1,l2,lq,则必定满足克拉夫特不等式定理4-2 将码C中所有可能的尾随后缀组成一个集合F,当且仅当集合F中没有包含任一码字,则可判断此码C为唯一可译码。,4.2 定长编码,定理4-3 定长(等长)编码定理:由L个符号组成的、每个符号熵为HL(X)的无记忆平稳信源符号序列X1X2X3XL用KL个符号Y1Y2YKL(每个符号有m中可能值)进行定长变码。对任意,只要则当L足够大时,必可使译码差错小于;反之,当 时,译码差错一定是有限值,当L足够大时,译码几乎必定出错。,4.2 定长编码,4.2 定
6、长编码,例4-3设离散无记忆信源概率空间为信源熵为,4.2 定长编码,自信息方差为,4.2 定长编码,对信源符号采用定长二元编码,要求编码效率,无记忆信源有因此可以得到如果要求译码错误概率,则由此可见,在对编码效率和译码错误概率的要求不是十分苛刻的情况下,就需要个信源符号一起进行编码,这对存储和处理技术的要求太高,目前还无法实现。,4.3 变长编码,定理4-4 香农单符号变长编码定理:若离散无记忆信源的符号熵为H(S),每个信源符号用r进制码元进行变长编码,一定存在一种无失真编码(唯一可译编码)方法,其码字的平均长度满足:,4.3 变长编码,定理4-5 香农离散平稳无记忆序列变长编码定理,即:
7、若对信源离散无记忆信源S的N次扩展信源SN进行编码,则总可以找到一种编码方法,构成惟一可译码,使信源S中每个信源符号所需的平均码长满足:,4.3.1 编码空间,在信源编码的时候,我们可以如何使得编码最短,但是越短的编码,也容易造成唯一不可译。以异前缀编码为例,如果编的过短,会使得大量的码字不可用,如果较长,则影响不大。为了便于理解,我们这里提出一种新概念-编码空间。,4.3.1 编码空间,实际上它是一个相对量,是指一个编码占用的可以使用的编码的比例,考虑异前缀编码,显然一个二进制的编码,如果将0作为码字,所有以0开头的编码都不能再用,则有一半的编码将不能继续作为码字,如果是两位,则有四分之一的
8、码字不能使用,对于十进制,一个一位的十进制占用的比例为十分之一,依此,一个n位的k进制占用的编码空间为1/kn,当占用的编码空间小于等于1的时候,异前缀码是可能存在的,如果大于1,则不可能存在。,4.3.2 香农码,香农第一定理指出,选择每个码字的长度Ki满足下式的整数:logmpiKi1logmpi 例4-4设无记忆信源的概率空间为:,4.3.2 香农码,以二进制编码为例,香农编码方法如下:将信源消息符号按其出现的概率大小依次排列 p(u1)p(u2)p(un)确定码长Ki(整数):Mi=取整;Ki=Mi+1,如果 Mi是小数;Ki=Mi,如果Mi是整数 为了编成唯一可译码,计算第i个消息的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息论 编码 失真 信源
链接地址:https://www.31ppt.com/p-5230769.html