《声音的编码》PPT课件.ppt
声音的编码信息压缩,什么是声音?,因物体的振动而产生的一种物理现象。,20kHz 超声波,采样频率(Hz)(奈魁斯特采样定理:采样频率不应低于声音信号最高频率的两倍,这样就能把以数字表达的声音还原成原来的声音),声音的数字化,步骤:1)采样2)量化和编码,声卡,思考:采样频率、量化位数与声音质量、存储容量的关系,采样频率越高,量化位数越多,音质越逼真,所占存储空间越大。,例:以CD音乐为例,采样频率为44.1KHz,量化的值用16位二进制数表示,立体声双声道,一首5分钟的歌曲,需要多少字节的存储空间?,441001623008=52920000B51MB,计算声音文件的大小,声音文件容量计算公式:存储容量(字节)=采样频率量化位数声道数时间(秒)8,计算机中常见的声音文件格式,1.cda格式(天籁之音)标准CD格式是44.1K的采样频率,速率88K/秒,16位量化位数,因为CD音轨可以说是近似无损的,因此它的声音基本上是忠于原声的,因此如果你如果是一个音响发烧友的话,CD是你的首选。它会让你感受到天籁之音。CD光盘可以在CD唱机中播放,也能用电脑里的各种播放软件来重放。一个CD音频文件是一个.cda文件,这只是一个索引信息,并不是真正的包含声音信息,所以不论CD音乐的长短,在电脑上看到的“.cda文件”都是44字节长。注意:不能直接的复制CD格式的.cda文件到硬盘上播放,需要使用象EAC这样的抓音轨软件把CD格式的文件转换成WAV。,计算机中常见的声音文件格式,2.wav格式(无损的音乐)存放的是对模拟声音波形经数字化采样、量化和编码后得到的音频数据。原本由声音波形而来,所以WAV文件又称波形文件。WAV文件对声源类型的包容性强,只要是声音波形,不管是语音、乐音,还是各种各样的声响,甚至于噪音都可以用WAV格式记录并重放。当采样频率达到44.1kHz、量化采用16位并采用双通道记录时,就可以获得CD品质的声音。WAV文件是Windows环境中使用的标准波形声音文件格式。,计算机中常见的声音文件格式,3.mp3格式(流行的风尚)它是对已经数字化的波形声音文件采用MP3压缩编码后得到的文件。MP3压缩编码是运动图像压缩编码国际标准MPEG-1所包含的音频信号压缩编码方案的第3层。与一般声音压缩编码方案不同,MP3主要是从人类听觉心理和生理学模型出发,研究出的一套压缩比高、声音压缩品质又能保持很好的压缩编码方案。所以,MP3现在得到了广泛的应用,并受到电脑音乐爱好者的青睐。,计算机中常见的声音文件格式,4.midi格式(作曲家的最爱)MIDI的含义是乐器数字化接口(Musical Instrument Digital Inerface),它本来是由全球的数字电子乐器制造商建立起来的一个通信标准,以规定计算机音乐程序、电子合成器和其他电子设备之间交换信息与控制信号的方法。按照MIDI标准,可用音序器软件编写或由电子乐器生成MIDI文件。一首MIDI乐曲记录的不是音乐本身,而是数字描述的乐谱,包括音符、节拍、定时及所用乐器等。在MIDI文件中,包含着音符、定时和多达16个通道的演奏定义。每个通道的演奏音符又包括键、通道号、音长、音量和力度等信息。显然,MIDI文件记录的是一些描述乐曲如何演奏的指令而非乐曲本身。与波形声音文件相比,同样演奏长度的MIDI音乐文件比波形音乐文件所需的存储空间要少很多。例如,同样30分钟的立体声音乐,MIDI文件大约只需200KB,而波形文件要大约300MB。,计算机中常见的声音文件格式,5.ra格式(流动的旋律)这种格式真可谓是网络的灵魂,强大的压缩量和极小的失真使其在众多格式中脱颖而出。和MP3相同,它也是为了解决网络传输带宽资源而设计的,因此主要目标是压缩比和容错性,其次才是音质。,计算机中常见的声音文件格式,6.wma格式(最具实力的敌人)是微软开发的音频格式,可以使用windows media player播放。音质要强于MP3格式,更远胜于RA格式,是以减少数据流量但保持音质的方法来达到比MP3压缩率更高的目的,WMA的压缩率一般都可以达到1:18左右。,信息压缩,信息为什么能被压缩,冗余信息的存在冗余类型:1)空间冗余:规则物体和规则背景的表面物理特性具有相关性。2)时间冗余:序列图像中的两幅相关图像之间有较大的相关性。3)视觉掩盖效应:对亮度敏感,对色彩的分辨率弱。,压缩方法,1.无损压缩 对压缩后的数据进行还原,还原后的数据与原来的数据完全相同。常用工具:winZip,winRAR2.有损压缩 对压缩后的数据进行还原,还原后的数据没有原来的精确,质量有所损失,但不会导致人们对原始数据表达的信息产生误解。常见格式:mp3,jpg,mpeg,,