《音频数字化》PPT课件.ppt
复制PPT文件,自学并完成以下内容:1、声音的数字化原理2、声音数字化后其质量取决于哪些因素?3、声音数字化所占用的存储空间4、声音的压缩和常见声音文件的格式:,声音的数字化原理 声音是大自然的恩赐,它使整个世界充满生机 声音是由物体振动产生的,是一种波。,声波通过话筒转变为时间上连续的电压波,电压波与引起电压波的声波的变化规律是一致的因此可以利用电压波来模拟声音信号,这种电压波被称为-模拟音频信号(如磁带、录像带上的声音信号)播放时音响设备将电压波传至扬声器,扬声器的振动产生声音,从而将模拟音频电信号还原为声音。,由于计算机只能处理二进制数字信息,以二进制数字来记录电压的幅度(声波),即转换为数字音频,才能被存储和处理-声音的数字化,011010001000111110111,声音的数字化,过程如下图所示:,(1).采样和量化,(c)采样信号的量化(度量单位),(a)模拟音频信号,(b)音频信号的采样,数字化音频的过程如下图所示。,电压0.30.20.100-0.1-0.2-0.3,011010001000111110111,时间,电压0.30.20.100-0.1-0.2-0.3,时间,时间,(2)编码(刻度)量化编码示意,同一段声音进行采样时,间隔的时间越短,采样的次数越多,采样越密集,这样获得的音频就越接近原始声音的真实面貌。采样的密集程度,可用每秒种采样的次数-采样频率 单位:HZ(1/秒)1000HZ=1000次/秒,1).采样频率:指一秒钟时间内采样的次数。常用采样频率有三种:11.025KHz(语音效果)-11025次/秒 22.05KHz(音乐效果)-22050次/秒 44.1KHz(高保真效果如CD唱盘)-44100次/秒,人耳听觉的声音频率范围:20HZ20KHZ采样定律:采样频率不应抵于声音信号最高频率两倍当采样频率达到40KHZ以上时,人耳听觉认为数字音频已达到保真程度。-CD唱盘44.1KHZ,请同学们思考:影响数字音频质量的因素有哪些?,(2).影响数字音频质量的技术参数,数字音频的质量取决于 采样频率、量化位数和 声道数,2).量化位数(量化精度Y轴度量单位)描述每个采样点样值(电压值)的二进制位数。如:8位量化位数表示每个采样值可以用28即256个不同的量化值之一来表示 常用的量化位数为8位、12位、16位。0.1和0.11哪个更准确?,3).声道数 每次对一个通道声波进行采样和量化为单声道;每次对两个通道声波进行采样和量化为称为双声道(立体声),它更能满足人们的听觉需求。随着声道数的增加,所占用的存储容量也成倍增加。,小结:声音数字化质量,影响声音数字化质量的三个因素,一,如何计算数字音频文件的存储量?,例如:用44.1KHz的采样频率进行采样,量化位数选用16位,则录制1秒的立体声节目,其波形文件所需的存储量为:4410011682=176400(字节)约176KB,实践:1、如果CD音质的采样频率为44.1KHZ,量化位数为16bit,那么4分钟CD双声道立体声音乐的数据长度是多少?176KB*240 约41.3MB,(3).数字音频文件的存储量(字节B)采样频率时间(S)量化位数/8声道数-(换算为B)总点数 每个点占用空间,复制PPT文件,P19自学并完成以下内容:4、声音的压缩和常见声音文件的格式:,数字音频的文件格式,1.WAV文件图象:bmp 波形文件是由采样数据组成,其还原音质较好,但文件数据量很大。2.MP3文件 MP3(MPEG Audio layer 3)是一种按MPEG标准的声音压缩技术制作的音频文件。特点:优美音质 高压缩比(1:12),3.WMA文件 WMA文件是Windows Media格式中的一个子集,而Windows Media格式是由Microsoft Windows Media技术使用的格式,包括音频、视频或脚本数据文件。优势:在保证只有MP3文件一半大小的前提下保持相同的音质,也可以在线听4。RA文件 在线音乐欣赏(ra,rm,rmx)根据网络带宽改变声音的质量,.MIDI文件-乐器数字接口(数字音乐的国际标准)Musical Instrument Digital InterfaceMIDI文件不是一段录好的声音,而是记录演奏乐器的各种信息或指令,如用哪一种乐器,什么时候按某个键,力度怎么样等等,至于播放时发出的声音,那是通过播放软件或者音源的转换而成的。播放MIDI文件就是按照记录合成音乐,46-竖琴,合成音色 2(温暖),46-竖琴,合成音色 2(温暖),优势:数据量很小、修改方便(与WAV相比)1分钟MIDI文件 510KB 10M不足:缺乏重现真实的自然音或语音,MIDI音乐可很好地达到原始乐器的品质,并能模拟各种声音(包括非自然界声音)。因此,MIDI 主要用于原始乐器作品、流行歌曲表演、游戏音效及电子贺卡音乐,MIDI软件有多种类型,有MIDI播放软件、演奏软件和创作软件。通常,大多数的媒体播放器都可以播放MIDI音乐,如WINDOWS9598的媒体播放器(Windows Media Player)除了媒体播放器以外,MIDI演奏软件和创作软件都可以作为MIDI的播放器使用,大部分软件还可以显示MIDI音乐的乐谱(五线谱或简谱)甚至歌词内容等信息,甚至打印乐谱,常见声音文件的存储格式,小 音质较好、文件小 对声卡要求低 压缩比:1:12,最小容易修改 要求声卡性能高 多媒体作品、网络,小 在压缩比和音质方面都超过了MP3 兼容软件多,压缩比1:18,小 音质教差,流媒体 在线收听网络音乐最好的一种格式,大 唱片格式,音质好 文件大,不能编辑 仅用于CD唱盘,2.2 音频压缩标准,声音的制作是使用麦克风或录音机来产生,再由声卡上的模/数转换器对模拟音频采样后,量化编码为一定字长的二进制序列,并在计算机内传输和存储。在数字音频回放时,再由数字到模拟的转化器(数/模转换器)解码可将二进制编码恢复成原始的声音信号,通过音响设备输出。如下图所示。,计算机,数字波形文件(WAV)数据量大,必须采用数据压缩编码技术。-便于储存、传输为什么可以压缩?一是声音信号存在着数据冗余;二是利用人的听觉特性来降低编码率,人的听觉具有一个强音能抑制一个同时存在的弱音现象,这样就可以抑制与信号同时存在的量化噪声;另外人耳对低频端比较敏感,而对高频端不太敏感,由此引出了“子带编码技术”。,音频压缩工具 豪杰超级解霸3000中的MP3格式转换器,答案:D,1.下列采集的波形声音()的质量最好 A.单声道、8位量化、22.05khz采样频率 B.双声道、8位量化、44.1khz采样频率 C.单声道、16位量化、22.05khz采样频率 D.双声道、16位量化、44.1khz采样频率,2数字音频采样和量化过程所用的主要硬件是。(A)数字编码器(B)数字解码器(C)模拟到数字的转换器(AD转换器)(D)数字到模拟的转换器(DA转换器),答案:C,3以下的采样频率中哪个是目前音频卡所支持的。(A)20KHz(B)11.025KHz(C)10KHz(D)50KHz,答案:B,答案:C,4音频卡是按 分类的。(A)采样频率(B)声道数(C)采样量化位数(D)压缩方式,习题:多媒体数据具有()特点。A.数据量大和数据类型多 B.数据类型间区别大和数据类型少 C.数据量大、数据类型多、数据类型间区别小、输入和输出不复杂 D.数据量大、数据类型多、数据类型间区别大、输入和输出复杂,答案:D,