《可视化计算》第6章信息论哈夫曼编码与二叉树A.ppt
《《可视化计算》第6章信息论哈夫曼编码与二叉树A.ppt》由会员分享,可在线阅读,更多相关《《可视化计算》第6章信息论哈夫曼编码与二叉树A.ppt(45页珍藏版)》请在三一办公上搜索。
1、第6章信息论、哈夫曼编码与二叉树 PART A,可视化计算,1,学习目标,什么是信息论中的信息?如何使用二进制编码进行表达信息?如何计算编码的信息量?为什么哈夫曼编码是最优编码?如何使用二叉树进行编码设计?常见的树结构的算法有哪些?,2,信息与信息论,信息的应用非常广泛,定义在不同的领域,也有不同,例如,在管理信息系统中:By information we mean data that have been shaped into a form that is meaningful and useful to human beings但是在计算机和通信领域:1948年,美国数学家、信息论的创始人
2、仙农在题为“通讯的数学理论”的论文中指出:“信息是用来消除随机不定性的东西”,3,案例1:灯笼报信,4,一个灯笼的故事,5,改进的报警方案,6,2的幂次和可表达的信息单元,7,灯笼的个数和信息单元的表达,8,反向思维,如果知道要传送的消息个数,怎样知道需要的最少比特数?如果需要报信的内容是一年内可能发生进攻的月份,需要多少灯笼?,9,数字表达,如果民兵希望发送英军中先头部队数量的消息时怎么办?假设教堂中的报信人知道英军先头部队有50个连,我们知道可以用不到50个灯笼来表达这种消息信息论告诉我们,民兵只要使用六个灯笼就可以表达英军50个连进攻的消息但要传送这个消息,哪些灯笼要打开,哪些要关闭呢?
3、,10,用灯笼来表示50,11,字符表达,假设要表达字母表中的26个字母,需要多少灯笼或比特呢?尽管看起来用5个比特已足够表达这26个字符,但是,英语中每个字母都有大小写,还有大量的标点符号、缩略语(如$、&、+)如果把这些计算在内,包括从0到9的数字,则总共有95个不同的字符需要表达,12,ASCII码表,13,熵与信息量,著名的美国数学家Claude Shannon在1948年定义“熵”来表达消息的信息量消息的信息量是一个非常有意思的概念,取决于我们对此消息已知的内容有时,我们只要问一个问题,就消除了再问的必要性,这种情况下,消息所含的信息量就很低,14,猜、猜、猜,如果你的朋友问你:“猜
4、猜我今天是怎么到学校的?”,你一定可以很容易的一下猜到,骑车而如果他是坐直升飞机来的?而如果他是坐宇宙飞船来的?猜测次数的多少,意味着“信息不确定性”的程度,越是难猜的信息,包含的信息值越大,15,07之间数字的猜测过程,16,哪支球队是冠军,可以把球队编上号,从1到32,猜/答一次,付钱一元然后提问:“冠军的球队在1-16号中吗?”假如他告诉我猜对了我会接着问:“冠军在1-8号中吗?”假如他告诉我猜错了,我自然知道冠军队在9-16中这样只需要五次,我就能知道哪支球队是冠军。所以,谁是世界杯冠军这条消息的信息量只值五块钱,17,如何少猜几次,信息量使用比特数计量并和所有可能情况的对数函数log
5、有关log2 32=5log2 64=6(64支参赛队)实际上象巴西、德国、意大利这样的球队得冠军的可能性比日本、美国、韩国等队大的多因此,当每个球队夺冠的可能性(概率)不等时,“谁世界杯冠军”的信息量实际比五比特少,18,实际上的信息量,香农指出,它的准确信息量应该是:-(p1log p1+p2 log p2+p32log p32)其中,p1,p2,p32 分别是这32个球队夺冠的概率香农把它称为“信息熵”(Entropy),一般用符号H表示,单位是比特,19,硬币的抛掷测试,假设一条消息出现的概率为p,那么其信息量就是 log2 p比特如果出现的正面的概率为1/2,那么其信息量就是-log
6、2 1/2=1比特如果因为重心等原因,出现的正面的概率为1,那么信息量就成了-log2 1=0比特,20,熵的定义,设随机变量X,取值空间,为有限集合;X的分布密度为p(x),p(x)=P(X=x),xX,则该随机变量的取值不确定程度,即其熵为:当使用log2时,熵的单位为比特反映一个信源发出不同信号,具有的平均信息量,21,利用信息论进行编码分析(1),计算英文字符(26字母加空格)为信息源的熵:设所有字符等概率出现:H(X)=-p(x)log2p(x)xX=27*-1/27log21/27=log227=4.75(bits/Letter),22,利用信息论进行编码分析(2),假设英文字符的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 可视化计算 可视化 计算 信息论 哈夫曼 编码 二叉
链接地址:https://www.31ppt.com/p-6075923.html