音频基础知识ppt课件.ppt
2022年11月15日星期二,多媒体技术音频基础,1,本章内容,音频的声学基础声音的数字化声音的存储格式MIDI音乐语音信号、非语音信号,2022年11月15日星期二,多媒体技术音频基础,2,音频媒体,音频(audio)或声音(sound)携带信息的极其重要的媒体多媒体技术研究中的一个重要内容与视觉媒体相比具有特殊性不同场合下的重要性不同Passive viewing (e.g. film, video, etc.)Video conferencing,2022年11月15日星期二,多媒体技术音频基础,3,声音的概念,声音是一种机械振动状态的传播现象,它表现为一种机械被即声波。产生声波的条件有作机械振动的物体:声源有能传播机械振功的弹性介质声波在介质中传播有一定速度,称之为声波的传播速度(声速),2022年11月15日星期二,多媒体技术音频基础,4,声波示意(L. A. Rowe ),压缩,稀薄,时间,幅度,正弦波,2022年11月15日星期二,多媒体技术音频基础,5,声波频率,声压变化可以是周期性的和非周期性频率概念循环(cycle)- 压缩/稀薄过程频率(frequency):每秒cycle数,单位 hertz (Hz)周期 cycle的持续时间 (1/frequency)声音信号一般由许多频率不同的信号组成,称为复合信号;而单一频率的信号称为分量信号,2022年11月15日星期二,多媒体技术音频基础,6,频率范围,频率小于20Hz 一般称为次声波(subsonic)人的听觉器官能感知的声音频率范围约为20Hz20kHz的信号称为音频(Audio)信号人发音器官发声频率约是803400Hz,但人说话的信号频率约为3003000Hz,即话音(speech)信号高于20kHz的信号称为超声波 (ultrasonic)超声波及次声波一般不能引起人听觉器官的感觉,但可借助一些仪器设备进行观察和测量,2022年11月15日星期二,多媒体技术音频基础,7,乐音与噪音,一般乐音指具有确定的基频以及与该基频有较小整数倍关系的各阶谐频(harmonic tone)频率比基音高的所有分音统称泛音(over tone),泛音的频率不必与基音成整数倍关系在主观上把令人不愉快或不需要的声音定义为噪音噪音的频谱较为复杂, 具有无规则的振幅和波形的连续频谱,2022年11月15日星期二,多媒体技术音频基础,8,声音要素(一),响度(音响)loudness到达人耳的声扰动振幅所产生的听觉的大小声振动能量是物理特性,可用声强(sound pressure)定义,单位:帕斯卡 (Pa)实用上通常都以对数方式的声压级 (sound pressure level)表示,单位:分贝(db)响度是主观量,不能用任何仪器正确地测量声音响度使用了以两个声强之比的对数为基础的相对标度,单位:宋(sone),2022年11月15日星期二,多媒体技术音频基础,9,声音要素(二),音调(音高)pitch或tone人对声音刺激频率的主观判断与估量,称之为音调 (Pitch),单位:美(Mel)Frequency是物理量,而音调是人的感觉听觉经验一般女生的声音比男生高较大物体振动的音调较低,2022年11月15日星期二,多媒体技术音频基础,10,声音要素(三),音色(音质)timber由其频谱决定不同乐器发出同一音高的乐音,仍然可以分辨可以把音色描述为音的瞬时横截面,即用谐音(泛音)的数目、强度、分布和相位来描述。泛音的强度可使音色发生变化,音色的主观特性比响度或音调的主观特性复杂得多。,2022年11月15日星期二,多媒体技术音频基础,11,模拟信号与数字信号,在时间和幅度上连续的信号为模拟(analog)信号。巴时间和幅度都用离散的数字表示的信号就称为数字(digital)信号采样(sampling)时间量化(quantization)幅度数字化实际上就是采样和量化,2022年11月15日星期二,多媒体技术音频基础,12,声音的采样和量化,两个关键参数:采样频率与量化精度,2022年11月15日星期二,多媒体技术音频基础,13,采样频率,每秒钟需要采集多少个声音样本根据奈奎斯特理论(Nyquist theory)和声音信号本身的最高频率决定的fs = 2f 或者 Ts = T/2如果一个信号中的最高频率为fmax,采样频率最低要选择2fmax,2022年11月15日星期二,多媒体技术音频基础,14,量化精度,反映度量声音波形幅度的精度,一般用每个声音样本的位数(bit per sample,bps)表示常见的量化精度有:8与16声音的质量越高,需要的存储空间越多,2022年11月15日星期二,多媒体技术音频基础,15,声音质量等级,2022年11月15日星期二,多媒体技术音频基础,16,声音质量的度量,声音质量的评价目前仍然是一个很困难的问题,需要继续研究声音质量的度量有两种基本的方法客观质量度量:主要用信噪比(signal to niose ratio,SNR)主观质量度量:主观平均判分法 对于图象等其它媒体数据的处理同样存在两种质量度量主客观结合?,2022年11月15日星期二,多媒体技术音频基础,17,存储格式(一),用.wav为扩展名的文件格式称为波形文件格式(WAVE File Format)RIFF:Resource Interchange File Format IBM和微软公司于1991年8月联合开发支持存储各种采样频率和样本精度的声音数据,并支持一定的声音数据的压缩主要用于PC 类似格式au(SUN),aiff(Apple),snd(SGI)http:/,精品课件!,精品课件!,2022年11月15日星期二,多媒体技术音频基础,20,存储格式(二),mp3/mp3 proRealAudio(ra)/RealMedia(rm)Ogg VorbisWMAQuickTime/QDesign MusicMIDIVQFMOD,