多媒体音频技术.ppt
《多媒体音频技术.ppt》由会员分享,可在线阅读,更多相关《多媒体音频技术.ppt(36页珍藏版)》请在三一办公上搜索。
1、多媒体音频技术,音频信息处理,第一节 声音的基本概念声音是一连续的波,称为声波声音的强弱体现在其振幅上,声音的音调的高低体现在声音的频率上声音信号由许多频率不同的信号组成,是复合信号声音的带宽:复合信号的频率范围例如 高保真声音的频率范围为10Hz20 000Hz,其带宽约为20KHz。次音信号 0Hz20Hz,音频信号20Hz20KHz,话音信号 300Hz3 000Hz,超音频信号:20KHz以上。,第二节 声音信号的数字化,模拟信号与数字信号在时间和幅度上都是连续的信号称为模拟信号在时间和幅度上都是用离散的数字表示的信号称为数字信号对模拟信号的处理比较复杂,难于精确控制,成本高。将模拟信
2、号转换成数字信号,处理简单,精确。声音信号的数字化采样在某特定时刻对模拟信号进行测量叫采样每隔相等的一段时间进行采样,称为均匀采样量化把信号幅度划分成若干小段,若每段都是相等的,称为线性量化,否则称为非线性量化。,采样频率采样频率即取样频率,指每秒钟取得声音样本的次数。采样频率越高,声音的质量也就越好。人耳的分辨率很有限,所以太高的频率就分辨不出来了;采样频率一般共分为22.05KHz、44.1KHz、48KHz三个等级,22.05只能达到FM广播的声音品质,44.1KHz是CD音质,48KHz则是DVD Audio或专业领域才会采用。根据奈奎斯特理论,采样频率不低于声音信号最高频率的两倍。这
3、样就能把数字表达的声音还原成原来的声音,称为无损数字化。采样定律用公式表示为fs 2f 或者 Ts T/2其中f为被采样信号的最高频率。采样(量化)精度样本大小是用每个声音样本的位数bit/s(即bps)表示的,它反映度量声音波形幅度的精度。既 用样本值的二进制位数来表示。位数越多精度越高,数据也越大。,第三节 音频编码基础,音频编码分类音频编码的目的在于压缩数据。在进行压缩时,要在音频质量、数据量、计算复杂度三方面进行考虑。音频编码的分类如下:基于音频数据的统计特性进行编码(波形编译码器)(其目标是使重建语音波形保持原波形的形状。如:PCM(脉冲编码调制)、DPCM(差分脉冲编码调制)、AP
4、CM(自适应脉冲编码调制)、ADPCM(自适应差分脉冲编码调制)基于音频的声学参数,进行参数编码(音源编译码器)这类编码数据率低,但质量清晰度低。上述两种编码算法结合称为混合编码。基于人的听觉特性进行编码,数据的压缩必然引起音频质量的降低。评价编码/解码器一般根据以下几个参数:音频质量、数据率、编码/解码延时和算法复杂度。,音频编码算法的评价,数字音频的质量与采样频率和量化精度有关。数字音频可分以下几个等级,声音质量的度量(用带宽度量),声音质量和数据率,507 000Hz,电话质量,AM质量音乐 FM质量 CD质量,对于音频质量的评价分为客观评定和主观评定。客观评定是通过测量一些特性来评价度
5、量,主要用信噪比(signal to niose ratio,SNR)。广泛使用的是主观评定,以主观意见打分(Mean Opinion ScoreMOS)来度量:,声音质量的度量另外两种方法(主/客观评价),1.概述MIDI是Musical Instrument Digital Interface的首写字母组合词,可译成“电子乐器数字接口”。用于在音乐合成器(music synthesizers)、乐器(musical instruments)和计算机之间交换音乐信息的一种标准协议.MIDI是乐器和计算机使用的标准语言,是一套指令(即命令的约定),它指示乐器即MIDI设备要做什么,怎么做,如演
6、奏音符、加大音量、生成音响效果等。MIDI不是声音信号,在MIDI电缆上传送的不是声音,而是发给MIDI设备或其它装置让它产生声音或执行某个动作的指令。MIDI标准下列几个优点:生成的文件比较小,因为MIDI文件存储的是命令,而不是声音波形;容易编辑,因为编辑命令比编辑声音波形要容易得多;可以作背景音乐,因为MIDI音乐可以和其它的媒体,如数字电视、图形、动画、话音等一起播放,这样可以加强演示效果。产生MIDI乐音的方法很多,现在用得较多的方法有两种:一种是(frequency modulation,FM)合成法,另一种是乐音样本合成法,也称为波形表(Wavetable)合成法,声音的合成,让
7、计算机演奏音乐最简单的方法是采用录音/重放的方式。这种方法数据量大。另一种方法是采取合成的方式产生音乐。1976年,FM(frequency modulation,FM)调频合成法产生,1984年另一种合成技术是乐音样本合成法,也称为波形表(Wavetable)合成法产生。一、调频音乐合成音乐包括确定的基频谱和这个基频整数倍的谐波谱。这是与噪声不同的地方。一个音乐必须有音高、音色、响度和持续时间4个因素。音高是指声波的基频。基频越低给人的感觉越低沉。音色是由声音的频谱决定。人们能分辨出相同音高的小提琴和钢琴的声音,是因为它们的音色不同。小号有较强的穿透力是其声音中的高次谐波非常丰富。响度可通过
8、调节声波的整体幅度来实现。时值的变化导致旋律的进行,或平缓,或跳跃。通过对上述参数的控制来合成音乐是FM的基本思想。,FM合成器生成乐音的基本原理如图所示。它由5个基本模块组成:数字载波器、调制器、声音包络发生器、数字运算器和模数转换器。,声音合成器的波形,各种不同乐音的产生是通过组合各种波形和各种波形参数并采用各种不同的方法实现的。用什么样的波形作为数字载波波形、用什么样的波形作为调制波形、用什么样的波形参数去组合才能产生所希望的乐音,这就是FM合成器的算法。,改变数字载波频率可以改变乐音的音调,改变它的幅度可以改变它的音量。改变波形的类型,如用正弦波、半正弦波或其它波形,会影响基本音调的完
9、整性。快速改变调制波形的频率(即音调周期)可以改变颤音的特性。改变反馈量,就会改变正常的音调,产生刺耳的声音。选择的算法不同,载波器和调制器的相互作用也不同,生成的音色也不同。,通过改变FM合成器参数,可以生成不同的乐音,二、乐音样本合成声音使用FM合成法来产生各种逼真的乐音是相当困难的,有些乐音几乎不能产生,因此很自然地就转向乐音样本合成法。这种方法就是把真实乐器发出的声音以数字的形式记录下来,播放时改变播放速度,从而改变音调周期,生成各种音阶的音符。乐音样本的采集相对比较直观。音乐家在真实乐器上演奏不同的音符,选择44.1 kHz的采样频率、16位的乐音样本,这相当于CD-DA的质量,把不
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多媒体 音频 技术
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-6109381.html