信息论与编码ppt.ppt
《信息论与编码ppt.ppt》由会员分享,可在线阅读,更多相关《信息论与编码ppt.ppt(294页珍藏版)》请在三一办公上搜索。
1、信息论与编码,主讲:苗立刚基础楼319,计算机与通信工程学院2016年3月,课程目标与安排,它是信息处理方向的一门重要的专业基础课,是后续课程的基础,如通讯原理、数字图像处理、语音信号处理等。介绍信息科学的基础理论和基本方法,课程将基于一个通讯系统的抽象数学模型进行展开,课程分为基础理论和编码理论两部分组成。本课程以概率论为基础,数学推导较多,学习时主要把注意力集中到概念的理解上,不过分追求数学细节的推导。注意基本概念的理解,不断加深概念的把握。学习时注意理解各个概念的“用处”,结合其他课程理解它的意义,而不要把它当作数学课来学习。,课程特点,学 时:32 考试方式:开卷考试成绩:平时成绩*2
2、0%+考试成绩*80%,课程目标与安排,第一章 绪论第二章 信源熵第三章 信道容量第四章 信息率失真函数第五章 信源编码第六章 信道编码第七章 密码体制的安全性测度,课程内容安排,课程目标与安排,课程目标与安排,参考书,曲炜,朱诗兵,信息论基础及应用,清华大学出版社,2005信息论与编码,陈运、周亮、陈新,电子工业出版社,2007傅祖芸,信息论与编码,电子工业出版社,2004周荫清,信息论基础(第3版),北京航空航天大学出版社,2006,有关的课程,高等数学,概率论,线性代数,第一章 绪论,信息论基础,主讲:苗立刚基础楼318,计算机与通信工程学院2014年3月,第一章 绪论,信息的有关概念
3、通讯系统模型 信息论的形成和发展历史,本章主要讨论的问题:,信息的有关概念,“信息”是信息论中最基本、最重要的概念,它是一个既抽象又复杂的概念,目前还没有一个统一的定义(百余种);“信息”不同于消息在现代信息论形成之前,信息一直被看作是通信中消息的同义词,没有严格的数学含义;所谓消息,是用文字、符号、数据、语言、图片、图像等形式,把客观事物运动和主观思维活动的状态表达出来;消息是信息的载体;消息是表现形式,信息是实质。“信息”不同于情报情报往往是军事学、文献学方面的习惯用词,它的含义比“信息”窄的多,一般只限于特殊的领域,是一类特殊的信息;“情报”是人们对于某个特定对象所见、所闻、所理解产生的
4、知识;,“信息”不同于知识知识是人们根据某种目的,从自然界收集得来的数据中整理、概括、提取得到的有价值的信息,是一种高层次的信息;知识是信息,但不等于信息的全体;“信息”不同于信号把消息变换成适合信道传输的物理量,就是信号;信号是承载消息的物理量;,信息的有关概念,信息的有关概念,信息的几种定义 以信源为主的信息定义、以信道为主的信息定义和以信宿为主的信息定义。以信源为主的信息定义有:1)信息是事物之间的差异(Longo,1975)2)信息是有序性的度量(Wiener,1948)以信道为主的信息定义有:1)信息是通信传输的内容(Wiener,1950)2)信息是人与外界相互作用的过程中所交换的
5、内容的名称(Wiener,1948)以信宿为主的信息定义有:1)信息是用来消除随机不定性的东西(Shannon,1948)2)信息是使概率分布发生变动的东西(Tribes etal,1971),仙农从研究通信系统传输的实质出发,对信息做出了科学的定义;仙农注意到:收信者在收到消息之前是不知道消息的具体内容的。通信系统消息的传输对收信者来说,是一个从不知到知的过程,或者从知之甚少到知之甚多的过程,或是从不确定到部分确定或全部确定的过程。因此,对于收信者来说,通信过程是消除事物状态的不确定性的过程,不确定性的消除,就获得了信息,原先的不确定性消除的越多,获得的信息就越多;“信息”是事物运动状态或存
6、在方式的不确定性的描述,这就是仙农关于信息的定义。,信息的有关概念,信息的度量,信息的度量(信息量)和不确定性消除的程度有关,消除了多少不确定性,就获得了多少信息量;不确定性就是随机性,可以用概率论和随机过程来测度不确定性的大小,出现概率小的事件,其不确定性大,反之,不确定性小;由以上两点可知:概率小 信息量大,即信息量是概率的单调递减函数;此外,信息量应该具有可加性;,信息的度量,由于信息量与概率成反比,并且具有可加性,可以证明,信息量的计算式为 其中pk是事件xk发生的概率,这也是仙农关于(自)信息量的度量(概率信息),单位为bit,哈特莱早在20世纪20年代就提出用对数作为信息量的测度。
7、哈特莱认为:消息和信息不同,多种多样、千姿百态的消息是信息的载体,消息究竟包含了多少信息,应该用消息出现的概率的对数来计算,从而他为信息度量找到了对数这一数学理论。,通讯系统模型,信源,编码器,信道,译码器,干扰源,通信系统基本模型,消息,信号,消息,信宿,噪声,信源:消息的来源,如文字、语音、图像等编码器:把消息变换成信号,如信源编码、纠错编码、调制器信道:传递信号的媒介,如电缆、光纤、无线电波等噪声:信道中的干扰,如加性干扰、乘性干扰译码器:把信道输出的信号反变换,解调器、纠错译码器、信源译码器信宿:信息的接受端,接收消息的人或物,通讯系统模型,信源:消息的来源编码器:把消息变换成信号信道
8、:传递信号的媒介译码器:把信道输出的信号反变换信宿:信息的接受端噪声:信道中的干扰,信源编码器:把信源发出的消息变换成由二进制码元(或多进制码元)组成的代码组以提高通信系统传输消息的效率。信源编码可分为无失真信源编码和限失真信源编码。目的:提高信息传输的有效性信道编码器:在信源编码器输出的代码组上有目的地增加一些监督码元,使之具有检错或纠错的能力。目的:提高信息传输的可靠性密码学:研究如何隐蔽消息中的信息内容,使它在传输过程中不被窃听,提高通信系统的安全性。目的:提高信息的安全性,编码问题可分解为三类:信源编码、信道编码和密码,在实际问题中,上述三类编码应统一考虑来提高通信系统的性能。这些编码
9、的目标往往是相互矛盾的。,电报常用的莫尔斯码就是按信息论的基本编码原则设计出来的;在一些商品上面有一张由粗细条纹组成的标签,从这张标签可以得知该商品的生产厂家、生产日期和价格等信息,这些标签是利用条形码设计出来的,非常方便,非常有用,应用越来越普遍;计算机的运算速度很高,要保证它几乎不出差错,相当于要求有100年的时间内不得有一秒钟的误差,这就需要利用纠错码来自动地及时地纠正所发生的错误;每出版一本书,都给定一个国际标准书号(ISBN),大大方便图书的销售、编目和收藏工作。,编码的应用的几个例子:,通讯系统模型,信息论的形成和发展,信息论是在长期通信工程的实践中,由通信技术与概率论、随机过程和
10、数理统计相结合而逐步发展起来的一门科学。奈魁斯特:在1924年研究影响电报传递速度的因素时,就察觉到信息传输速度和频带宽度有关系;哈特莱(Hartley):在1928年用概率的观点来分析信息传输问题;仙农(Claude E.Shannon):1948年发表通信的数学理论(A Mathematical Theory of Communication),为创立信息论作出了决定性的贡献;香农因此成为信息论的奠基人。维纳(N.Wiener)等:为信息论的进一步发展和拓展作了大量工作;主要在通信的统计理论与滤波器理论方面。,第二章 信源熵,信息论基础,主讲:苗立刚基础楼318,计算机与通信工程学院201
11、4年3月,第二章 信源熵,2.1 单符号离散信源2.2 多符号离散平稳信源2.3 连续信源2.4 离散无失真信源编码定理,本章主要讨论的问题:,2.1单符号离散信源,单符号离散信源的数学模型,单符号信源信源每次输出一个符号,用离散随机变量描述 多符号信源信源每次输出多个符号(符号序列),用离散随 机矢量描述 离散信源信源符号取值离散,包括单符号和多符号信源 连续信源信源符号取值连续,用随机过程描述 结论 从概率、随机变量(过程)来研究信息 信息对事物状态(存在方式)不确定性的描述,2.1单符号离散信源,单符号离散信源的数学模型,注意:大写字母X,Y,Z代表随机变量,小写字母代 表随机事件。,概
12、率复习,2.1单符号离散信源,由于信息量与概率成反比,并且具有可加性,自信息量的定义为:其中p(xi)是事件xi发生的概率,这也是仙农关于(自)信息量的度量(概率信息)计算信息量主要要注意有关事件发生概率的计算;性质:非负;单调递减;当p(xi)=0时,I(xi),不可能事件;当p(xi)=1时,I(xi)0,确定事件自信息量 I(xi)的含义当事件xi发生以前,表示事件xi发生的不确定性;当事件xi发生以后,表示事件xi所提供的信息量;,自信息量(单个随机事件),例1:从26个英文字母中,随即选取一个字母,则该事件的自信息量为 I=-log2(1/26)=4.7 比特 例2:设m比特的二进制
13、数中的每一个是等概率出现的(这样的数共有2m个),则任何一个数出现的自信息为:I=-log2(1/2m)=m 比特/符号,自信息量的单位自信息量的单位取决于对数的底;底为2,单位为“比特(bit)”;底为e,单位为“奈特(nat)”;底为10,单位为“哈特(hat)”;1 nat=1.44bit,1 hat=3.32 bit;,2.1单符号离散信源,例3:设天气预报有两种消息,晴天和雨天,出现的概率分别为1/4和3/4,我们分别用 来表示晴天,以 来表示雨天,则我们的信源模型如下:,2.1单符号离散信源,联合自信息量(两个随机事件),二维联合集XY上的元素(xiyj)的联合自信息量定义为:含义
14、 X=xi,Y=yj 同时发生时,带来的信息量 特例 若X、Y 独立,则I(xiyj)=I(xi)+I(yj),2.1单符号离散信源,条件自信息量(两个随机事件),二维联合集XY中,对事件xi和yj,事件xi在事件yj给定的条件下的条件信息量定义为:,联合自信息量和条件自信息量也满足非负和单调递减性。关系当X和Y独立时,,2.1单符号离散信源,互信息量(两个随机事件),2.1单符号离散信源,信源发出消息 的概率 称为先验概率,信宿收到 后推测信源发出 的概率称为后验概 率。定义 的后验概率与先验概率比值的对数为 对 的互信息量,用 表示,即互信息量等于自信息量减去条件自信息量。第三种表达方式:
15、,2.1单符号离散信源,含义互信息I(xi;yj)=自信息I(xi)-条件自信息I(xi/yj)(1)I(xi)信宿收到yj之前,对信源发xi的不确定度(2)I(xi|yj)信宿收到yj之后,对信源发xi的不确定度(3)I(xi;yj)收到yj而得到(关于xi)的互信息=不确定度的减少量性质(1)对称性I(xi;yj)=I(yj;xi)(2)X与Y独立时I(xi;yj)=0(3)I(xi;yj)可为正、负、0(4)I(xi;yj)=I(xi);I(xi;yj)=I(yj),2.1单符号离散信源,I(xi;yj)可为正、负、0的举例设yj代表“闪电”,则当xi代表“打雷”时,I(xi|yj)=0
16、,I(xi;yj)=I(xi)0 当xi代表“下雨”时,I(xi|yj)I(xi),I(xi;yj)0当xi代表“雾天”时,I(xi|yj)=I(xi),I(xi;yj)=0当xi代表“飞机正点起飞”时,I(xi|yj)I(xi),I(xi;yj)0,2.1单符号离散信源,条件互信息量(三个随机事件),联合集XYZ中,给定条件 下,与 之间的互信息量,其定义式,互信息量,2.1单符号离散信源,平均自信息量(信源熵)-随机变量,单位 bit/(信源)符号,这个平均自信息量的表达式和统计物理学中热熵的表达式很相似。在统计物理学中,热熵是一个物理系统杂乱性(无序性)的度量。这在概念上也有相似之处。因
17、而就借用“熵”这个词把平均自信息量H(X)称为“信源熵”。,通常研究单独一个事件或单独一个符号的信息量是不够的,往往需要研究整个事件集合或符号序列(如信源)的平均的信息量(总体特征),这就需要引入新的概念;定义自信息的数学期望为信源的平均信息量,2.1单符号离散信源,例:天气预报,有两个信源,则:,说明第二个信源的平均不确定性更大一些,信息熵具有以下三种物理含义:1、表示信源输出前,信源的平均不确定性2、表示信源输出后,每个符号所携带的平均信息量3、反映了变量X的随机性。,2.1单符号离散信源,例:设某信源输出四个符号,其符号集合的概率分布为:则其熵为:,2.1单符号离散信源,例:电视屏上约有
18、 500 600=3105个格点,按每点有10个不同的灰度等级考虑,则共能组成n=103x105个不同的画面。按等概率1/103x105计算,平均每个画面可提供的信息量为,=31053.32 比特/画面,例:有一篇千字文章,假定每字可从万字表中任选,则共有不同的千字文N=100001000=104000篇。仍按等概率1/100001000计算,平均每篇千字文可提供的信息量为 H(X)log2N4103332=1.3104 比特千字文,“一个电视画面”平均提供的信息量远远超过“一篇千字文”提供的信息量。,2.1单符号离散信源,熵函数的数学特性,熵函数可以表示为:,二元熵:,性质1:非负性,H(X
19、)0由于0pi1,所以logpi0,logpi0,则总有H(X)0。,2.1单符号离散信源,性质2:对称性,根据加法交换律可以证明,当变量交换顺序时熵函数的值不变。信源的熵只与概率空间的总体结构有关,而与个概率分量对应的状态顺序无关;,性质3:扩展性,这说明信源空间中增加某些概率很小的符号,虽然当发出这些符号时,提供很大的信息量,但由于其概率接近于0,在信源熵中占极小的比重,使信源熵保持不变。,2.1单符号离散信源,性质4:可加性,性质5:极值性,上式表明,对于具有n个符号的离散信源,只有在n个信源符号等可能出现的情况下,信源熵才能达到最大值,这也表明等概分布的信源的平均不确定性最大,这是一个
20、很重要得结论,称为最大离散熵定理,例:对于一个二元信源 H(X)=H(1/2,1/2)=log2=1bit,H(X)=-plog2p(1-p)log2(1-p)=H(p),2.1单符号离散信源,性质6:确定性,当信源X的信源空间X,P中。任一个概率分量等于1,根据完备空间特性,其它概率分量必为0,这时信源为一个确知信源,其熵为0。如果一个信源的输出符号几乎必然为某一状态,那么这个信源没有不确定性,信源输出符号后不提供任何信息量。,性质7:上凸性,是概率分布(p1,p2,pq)的严格上凸函数。,2.1单符号离散信源,设f(X)=f(x1,x2,xn)为一多元函数。若对于任意一个小于1的正数(0=
21、f(X1)+(1-)f(X2)则称f(X)为定义域上的上凸函数。若“=”不成立,则为严格上凸函数若“=”,则为下凸函数若“”,则为严格下凸函数,2.1单符号离散信源,H(p)函数曲线如图所示。如果二元信源的输出符号是确定的,即p=1或q=1,则该信源不提供任何信息。反之,当二元信源符号0和1以等概率发生时,信源熵达到极大值,等于1比特信息量。,2.1单符号离散信源,信源熵是从整个信源的统计特性来考虑的,它是从平均意义上来表征信源的总体信息测度的。对于某特定的信源(概率空间给定),其信源熵是一个特定的值。不同的信源因统计特性不同,其熵也不同。信源熵用以表征信息源的平均不确定性,平均自信息量是消除
22、信源不确定性时所需信息的量度,即收到一个信源符号,全部解除了这个符号的不确定性。或者说获得这样大的信息量后,信源不确定性就被消除了。,2.1单符号离散信源,信源熵和平均自信息量两者在数值上相等,但含义不同。某一信源,不管它是否输出符号,只要这些符号具有某些概率特性,就必有信源的熵值;这熵值在总体平均上才有意义,因而是一个确定的值。而另一方面,信息量则只有当信源输出的符号被接收者收到后才有意义,信息量就是给予接收者的信息度量,该值本身可以是随机量,也可以与接收者的情况有关。,因此说信源熵是信源的平均不确定性的描述,一般情况下它并不等于平均获得的信息量。只是在无噪情况下,接收者才能正确无误地接收到
23、信源所发出的信息,消除了信源熵H(X)值大小的平均不确定性,所以获得的平均信息量就等于信源熵H(X)的值。在一般情况下获得的信息量是两熵之差,并不是信源熵本身。,2.1单符号离散信源,条件熵,思考:求条件熵时为什么要用联合概率加权?,条件熵是在联合符号集合XY上的条件自信息量的数学期望。在已知随机变量X的条件下,随机变量Y的条件熵定义为:,2.1单符号离散信源,条件概率,并且,当已知特定事件xi出现时,下一个出现的是yj 的不确定性为:,对集合Y中所有元素统计平均,其熵为:,上述熵值再对集合Y中的元素做统计平均,得条件熵:,同理可得:,条件熵H(X/Y)是一个确定值,表示信宿在收到Y后,信源X
24、仍然存在的不确定度。这是信道干扰所造成的。有时称H(X/Y)为信道疑义度,也称损失熵。如果没有干扰,H(X/Y)=0,一般情括下H(X/Y)小于H(X),说明经过信道传输,总能消除一些信源的不确定性,从而获得一些信息。条件熵H(Y/X)也是一个确定值,表示信源发出X后,信宿仍然存在的不确定度。这是由于噪声引起的。也称为噪声熵。,2.1单符号离散信源,联合熵(共熵),联合离散符号集合XY上的每个元素对 的联合自信息量的数学期望。,说明:联合熵H(XY)表示X和Y同时发生的不确定度。,2.1单符号离散信源,加权熵(自学),对香农熵引入主观因素效用权重系数(重量)定义:设信源X 则加权熵 Hw(X)
25、含义 消息xi 的权重wi对I(xi)的加权平均性质:略,2.1单符号离散信源,从通信系统角度看熵的意义,H(X):表示信源边每个符号的平均信息量(信源熵);H(Y):表示信宿边每个符号的平均信息量(信宿熵);H(X|Y):信道疑义度(含糊度),表示在输出端接收到Y后,发送端X尚存的平均不确定性。这个对X尚存的不确定性是由于信道干扰引起的。H(Y|X):噪声熵,表示在已知X后,对于输出Y尚存的平均不确定性;H(XY):表示整个信息传输系统的平均不确定性;,2.1单符号离散信源,各种熵的性质,联合熵H(XY)与熵H(X)及条件熵H(X/Y)之间存在下列关系:H(XY)H(X)H(Y/X)H(XY
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息论 编码 ppt
链接地址:https://www.31ppt.com/p-5230718.html