音频的数字化与语音编码.ppt
《音频的数字化与语音编码.ppt》由会员分享,可在线阅读,更多相关《音频的数字化与语音编码.ppt(67页珍藏版)》请在三一办公上搜索。
1、第五章 音频的数字化与语音编码,学习内容,第一节 音频的数字化1、声音2、模拟音频与数字音频3、音频的采样、量化和数字化(重点)4、数字音频的格式,学习内容,第二节 语音编码1、人耳的听觉特性2、脉冲编码调制(PCM)3、G.711标准、G.721标准、G.722标准(重点),学习目标,1、了解声音相关概念及要素2、掌握音频采样、量化和数字化原理3、了解数字音频的文件格式4、掌握常见的音频压缩编码方法 5、理解G.711、G.721、G.722标准,第一节 音频的数字化,一、声音,声音是通过空气传播的一种连续的波,叫声波。声音的强弱体现在声波压力的大小上音调的高低体现在声音的频率上,一、声音有
2、关概念,复合信号:声音信号由许多频率不同的信号组成,分量信号:单一频率的信号,带宽:描述组成复合信号的频率范围。如:高保真声音的频率范围为10 Hz20K Hz,它的带宽约为20K Hz。,一、声音三要素,音强(volume)音调(pitch)音色,响度,由振幅决定 由频率决定 指声音频率组成成分,一、声音分类,次音频信号20kHZ(人听不到,有很强的方向性,可以形成波束),二、模拟音频与数字音频,模拟信号 数字信号,二、模拟音频与数字音频,模拟音频:在时间和幅度上都是连续变化的,数字音频:在时间和幅度上都是离散、不连续的,三、音频的数字化,模拟音频,数字音频,采样、量化、编码,三、音频的数字
3、化(采样),音频采样:当把模拟声音变成数字声音时,需要每隔一个时间间隔在模拟声音波形上取一个幅度值。,信号转换示意图,三、音频的数字化(采样),采样:将时间上连续的取值变为有限个离散取值的过程,三、音频的数字化(采样),奈奎斯特采样定理:,设连续信号X(t)的最高频率分量为Fm,以等间隔Ts(Ts称采样间隔,fs=1/Ts称为采样频率)对X(t)进行采样,得到Xs(t)。如果Fs=2Fm,则Xs(t)保留了X(t)的全部信息(从Xs(t)可以不失真地恢复出X(t))。,只要采样频率高于信号中最高频率的2倍,就可以从采样中完全恢复原始信号的波形。,三、音频的数字化(量化),音频量化:将经采样后幅
4、度上无限多个连续的样值变为有限个离散值的过程,三、音频的数字化(量化),量化过程:先将整个幅度划分成为有限个幅度(量化阶距)的集合,把落入某个阶距内的样值归为一类,并赋予相同的量化值。,量化等级的划分,三、音频的数字化,模拟信号,采样,量化,编码,A/D转换中,影响质量及数据量的主要因素:,每秒钟需要采集多少个声音样本即采样频率,每个声音样本的位数(bps)应该是多少即量化位数,三、音频的数字化,例子:每个声音样本用16位表示,测得声音样本值是在065536的范围里,它的精度就是输入信号的1/65536,声音质量与数据率,三、音频的数字化,四、数字音频的文件格式,1、WAV文件,声音是随着时间
5、连续变化的物理量,并且是一种能借助介质传播的波。,四、数字音频的文件格式,1、WAV文件,字节数/秒=采样频率(HZ)*量化位数(BIT)*声道数/8,特点:数据量大 音质好 不适合网络传播或播放,文件数据量计算:,?1分钟单声道,采样频率为11.025kHz,8位采样位数,四、数字音频的文件格式,2、MP3文件,MPEG Audio Layer-3特点:数据量较小,压缩率10:120:1 音质较好 是目前最为流行的音频格式文件,四、数字音频的文件格式,3、MIDI文件,数字乐器接口标准特点:midi文件中存储的是产生声音指令 数据量小,适用于:需要播放长时间高质量音乐,四、数字音频的文件格式
6、,3、MIDI文件,四、数字音频的文件格式,3、MIDI文件,四、数字音频的文件格式,4、ASF、WMA文件,微软开发的网上流式数字音频文件格式特点:音质好 数据量小 适合网络流式传输,四、数字音频的文件格式,5、RAM、RA文件,RealNetworks开发的网上流式数字音频文件格式特点:能随带宽的不同而改变音质,在保证大多数人听到流畅声音的前提下,带宽宽裕的听众获得较好的音质 适合低网速的实时传输,四、数字音频的文件格式,6、AIF、AU文件,Apple公司开发的音频文件格式,四、数字音频的文件格式,7、CD-DA,数字音频光盘44.1khz、16Bit量化位数、双声道,四、数字音频的文件
7、格式,8、MD,Mini DiscSony推出的便携式音乐格式MD汽车音响、随身听,五、音频文件的读取,工具:UltraEdit Debug 其他反汇编软件,WAVE文件作为多媒体中使用的声波文件格式之一,它是以RIFF格式为标准的。RIFF是英文Resource Interchange File Format(资源互换文件格式)的缩写,每个WAVE文件的头四个字节便是“RIFF”。对应的十六进制是52 49 46 46。,五、音频文件的读取,五、音频文件的读取,WAV文件结构,五、音频文件的读取,五、音频文件的读取,例:sound.wav,44.1kHz 16位 双声道12.68秒 2236
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 音频 数字化 语音 编码
链接地址:https://www.31ppt.com/p-5002620.html