信息论第4章无失真信源编码.ppt
《信息论第4章无失真信源编码.ppt》由会员分享,可在线阅读,更多相关《信息论第4章无失真信源编码.ppt(42页珍藏版)》请在三一办公上搜索。
1、第4章 无失真信源编码,重庆交通大学信息科学与工程学院通信工程系李益才2012年8月,第4章 无失真信源编码,4.1 信源编码的相关概念4.2 定长码及定长编码定理4.3 变长码及变长编码定理4.4 变长码的编码方法4.5 实用的无失真信源码方法,4.1 信源编码的相关概念,4.1.1 编码器信源输出的符号序列,需要变换成适合信道传输的符号序列,一般称为码序列,对信源输出的原始符号按照一定的数学规则进行的这种变换称为编码,完成编码功能的器件,称为编码器。接收端有一个译码器完成相反的功能。信源编码器的输入是信源符号集,共有q个信源符号。同时存在另一个符号集,称为码符号集,共有r个码符号,码符号集
2、中的元素称为码元或码符号,编码器的作用就是将信源符号集S中的符号 变换成由 个码符号组成的一一对应的码符号序列。编码器输出的码符号序列称为码字,并用 来表示,它与信源符号 之间是一一对应的关系,如图4.1所示。,4.1.1 编码器,码字的集合C称为码,即。信源符号 对应的码字 包含 个码符号,称为码字长度,简称码长。所以,信源编码就是把信源符号序列变换到码符号序列的一种映射。若要实现无失真编码,那么这种映射必须是一一对应的、可逆的。一般来说,人们总是希望把信源所有的信息毫无保留地传递到接收端,即实现无失真传递,所以首先要对信源实现无失真编码。,图4.1 信源编码器,4.1.1 编码器,信源编码
3、有以下3种主要方法:匹配编码 根据信源符号的概率不同,编码的码长不同:概率大的信源符号,所编的代码短;概率小的信源符号所编的代码长,这样使平均码长最短。这类编码主要有香农编码、哈夫曼编码、费诺码都是概率匹配编码,都是无失真信源编码。变换编码 先对信号进行变换,从一种信号空间变换为另一种信号空间,然后针对变换后的信号进行编码。包括DCT、DFT、DWT。识别编码识别编码主要用于印刷或打字机等有标准形状的文字符号和数据的编码,比如文字和语音的识别。后两种信源编码均为有失真的信源编码。无失真信源编码针对离散信源,连续信源在量化编码的过程中必然会有量化失真,连续信源只能近似地再现信源的消息。,4.1.
4、2 码的分类,分组码和非分组码定义4.1 将信源符号集中的每个信源符号固定地映射成一个码字,这样的码称为分组码。用分组码对信源符号进行编码时,为了使接收端能够迅速准确地将码译出,分组码必须具有一些直观属性。与分组码对应的是非分组码,又称为树码、树码编码器输出的码符号通常与编码器的所有信源符号都有关。奇异码与非奇异码定义4.2 若一种分组码中的所有码字都不相同,则称此分组码为非奇异码,否则称为奇异码。,4.1.2 码的分类,唯一可译码与非唯一可译码定义4.3 任意有限长的码元序列,如果只能唯一地分割成一个个码字,便称为唯一可译码。唯一可译码的物理含义是指不仅要求不同的码字表示不同的信源符号,而且
5、还要求对由信源符号构成的符号序列进行编码时,在接收端仍能正确译码而不发生混淆。唯一可译码首先是非奇异码,且任意有限长的码字序列不会雷同。即时码与非即时码定义4.4 无需考虑后续的码符号就可以从码符号序列中译出码字,这样的唯一可译码称为即时码。,4.1.2 码的分类,下面讨论唯一可译码成为即时码的条件。定义4.5 设 为一码字,对于任意的,称码符号序列的前j个元素 为码字的前缀。按照上述的前缀的定义,有下述结论:定理4.1 一个唯一可译码成为即时码 的充要条件是其中任何一个码字都不是 其他码字的前缀。即时码可以用树图来构造图5.2是一个二元即时码的树图,图5.2 二元即时码的树图,4.1.2 码
6、的分类,树是没有回路的图,所以它也是由节点和弧构成的树中最顶部的节点称为根节点,没有子节点的节点称为叶子节点。所有根节点的子节点称为一阶节点,所有一阶节点的子节点称为二阶节点,依此类推。阶节点最多有 个。节点的阶次又称为节点的深度。综上所述,可将信源编码作如下分类:,码,非分组码(树码),分组码(块码),奇异码,非奇异码,非唯一可译码,唯一可译码,即时码,非即时码,4.2 定长码及定长编码定理,若对一个有q个信源符号的信源S进行定长编码,那么信源S存在唯一可译定长码的条件是(4.1)其中,r是码符号集中的码元数,l是定长码的码长。如果对信源S的N次扩展信源 进行定长编码,若要编得的定长码是唯一
7、可译码,则必须满足(4.2)其中,q是信源S的符号个数,是信源S的N次扩展信源 的符号个数,r是码符号集X的码符号数。,4.2 定长码及定长编码定理,定长编码的信息传输效率是很低的。提高信息传输效率的方法有:方法1 考虑符号之间的依赖关系,对信源S的扩展信源进行编码。方法2对于概率等于0或非常小的符号序列不予编码。定理4.2 离散无记忆信源的熵为H(S),若对信源长为N的序列进行定长编码,码符号集X中有r个码符号,码长为l,则对于任意,只要满足 则当N足够大时,可实现几乎无失真编码,即译码错误概率任小;反之,如果 则不可能实现几乎无失真编码,即当N足够大时,译码错误概率为1。,4.2 定长码及
8、定长编码定理,定理5.2可以在离散平稳无记忆信源的条件下得到证明的,但它同样适合于平稳有记忆信源,只要将式中H(S)改为极限熵 即可,条件是有记忆信源的极限熵 和方差 存在。定长信源编码定理给出了定长编码时每个信源符号最少所需的码符号的理论极限,该极限值由H(S)决定。定义4.6 设熵为H(S)的离散无记忆信源,若对信源的长为N的符号序列进行定长编码,码符号集中码符号个数为 r,设码字长为l,定义 比特/信源符号为编码速 率,它表示平均每个信源符号编码后能载荷的最大信息量。这时,定理4.2的条件可表述为RH(S)+,即编码速率大于信源的熵才能实现几乎无失真编码。为了衡量编码效果,引进编码效率。
9、,4.2 定长码及定长编码定理,定义4.7 定义 为编码效率。由定理4.2可得最佳编码效率为,所以在已知方差和信源熵的条件下,信源符号序列长度N与最佳编码效率和允许错误概率 的关系为:当允许错误概率越小,编码效率又要高,那么信源符号序列长度N必须越长在实际情况下,要实现几乎无失真的定长编码,N需要的长度将会大到难以实现。,4.3 变长码及变长编码定理,4.3.1 Kraft不等式和McMillan不等式定理4.3 设信源符号集为,码符号集为,对信源进行编码,得到的码为,码长分别为。即时码存在的充要条件是 这称为Kraft不等式。由Kraft不等式可知,给定r和q,只要允许码字长度可以足够长,则
10、码长总可以满足Kraft不等式而得到即时码,Kraft不等式指出了即时码的码长必须满足的条件对于唯一可译码,该不等式又称为McMillan不等式。,(4.11),4.3.1 Kraft不等式和McMillan不等式,定理4.4 唯一可译码存在的充要条件是 r为码符号个数,li为码字长度,q为信源符号个数。定理4.4指出了唯一可译码中r、q、之间的关系,如果满足这个不等式的条件,则一定能够构成至少一种唯一可译码,否则,无法构成唯一可译码它给出了唯一可译变长码的存在性。另外,从定理4.3和定理4.4可以得到一个重要的结论,即任何一个唯一可译码均可用一个相同码长的即时码来代替,因为即时码很容易用树图
11、法构造,因此要构造唯一可译码,只要构造即时码就可以了。,(4.12),4.3.2 唯一可译码的判别准则,和于1957年提出下述算法用于判断码C的唯一可译性此算法的原理如下所示:其中 都是码字。可知,当且仅当某个有限长的码符号序列能译成两种不同的码字序列时,此码不是唯一可译码,此时 一定是 的前缀,而 的尾随后缀一定是另一码字 的前缀;而 的尾随后缀又是其他码字的前缀最后,码符号序列的尾部一定是一个码字。,4.3.2 唯一可译码的判别准则,设C为码字集合,按以下步骤构造此码的尾随后缀集合F:考查C中所有的码字,若 是 的前缀,则将相应的后缀作为一个尾随后缀码放入集合 中;考查C和 两个集合,若
12、是 的前缀或 是 的前缀,则将相应的后缀作为尾随后缀码放入集合 中;即为码C的尾随后缀集合;若F中出现了C中的元素,则算法终止,返回假(C不是唯一可译码);否则若F中没有出现新的元素,则返回真。定理4.5 一个码是唯一可译码的充要条件是的 并集中没有C中的码字。,4.3.3 无失真变长编码定理,定义4.8 设有信源 编码后的码字分别为,各码字相应的码长分别为li 因为是唯一可译码,信源符号 和码字 一一对应,则定义此码的平均码长为 其中,表示每个信源符号平均需用的码元数。当信源给定时,信源熵H(S)就确定了,而编码后每个信源符号平均用 个码元来变换,故平均每个码元载荷的信息量即编码后信源的信息
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息论 失真 信源 编码
链接地址:https://www.31ppt.com/p-6549794.html