第09讲音频编码技术.ppt
《第09讲音频编码技术.ppt》由会员分享,可在线阅读,更多相关《第09讲音频编码技术.ppt(50页珍藏版)》请在三一办公上搜索。
1、第09讲 音频编码技术,一切能发出声音的物体称为声源。声音是由于声源的振动而产生的,由于声源的振动,借助于它们周围的介质,把这种振动以机械波的形式由近及远地传向远方,这就是声波。声波传入人耳,致使耳膜也产生振动,这种振动被传导到听觉神经,人们就产生了“声音”的感觉。我们日常听到的声音是一种模拟信号,声学基础知识,声音的频率范围,模拟波信号有三个要素:基线、周期和振幅。振幅即波形的最高点(或最低点)与基线间的距离,它表示了声音音量的大小。周期是波形中两个相邻波峰之间的距离,它表示完成一次振动过程所需的时间,其大小体现了振动的速度。频率是周期的倒数,周期越短,频率越高。频率的单位为赫兹(Hz)。人
2、的耳朵只能感觉到振动频率在20Hz到20 000 Hz之间的声波,超出此范围的振动波不能引起听觉器官的感觉。其中,人耳对400-4000HZ的声波最敏感。,声音信号特性分析,人耳听觉特性,人耳对声音强弱的感觉特性,人耳对声音强弱的感觉与声压级成正比,安静的环境和嘈杂的环境中人耳可以分辨的声音不同。掩蔽:一个频率声音的听域由于另一个声音的存在而上升的现象。掩蔽效应:复合声音信号中,响度较低的声音频率分量被高者淹没。,响度是听觉判断声音强弱的属性主观,与声压级有一定关系:声压级每增加10dB,响度增加1倍。,响度和响度级,人耳听觉的掩蔽效应,声音质量评价,我们经常会对某一位歌手的歌声发表意见,并与
3、其他歌手进行比较,这其实是在对声音的质量进行评价。声音质量的度量有两种基本方法:客观质量度量、主观质量的度量。,声波的测量与分析传统的方法是先用机电换能器把声波转换为相应的电信号,然后用电子仪表放大到一定的电压级进行测量与分析。由于计算技术的发展,使许多计算和测量工作都使用了计算机或程序实现。这些带计算机处理系统的高级声学测量仪器,能完成下列一些测量工作:评价值的测量响度和响度级,噪音级,清晰度指数,噪音评价数。声源的测量频谱的时间变化,声功率,指向性,效率,频谱特征,幅值分布等。音质的测量混响时间,隔音量,吸音量。,声音客观质量的度量方法,声测量的基本仪器是声级计。声级计是一种能对声音作出类
4、似人耳的反应的仪器,同时,它能进行客观而可重复的声压和声级测量。声压测量的好处很多:它能帮助音乐厅提高音响效果;能对烦扰声音进行精密的、科学的分析。声级测量还能明确地告诉我们什么声音会引起听力损害,并提醒人们采用适当的听力保护措施。因此,声测量是不可少的。,度量声音客观质量的一个主要指标是信噪比SNR(Signal to Noise Ration)。其单位是分贝(dB)。,声音主观质量的度量,采用客观标准方法很难真正评定某种编码器的质量,在实际评价中,主观的质量度量比客观质量的度量更为恰当和合理。通常是对某编码器的输出的声音质量进行评价,例如播放一段音乐,记录一段话,然后重放给实验者听,再由实
5、验者进行综合评定。可以说,人的感觉机理最具有决定意义。当然,可靠的主观度量值是较难获得的。,平均判分(Mean Opnion Scose-MOS)过程是召集一批实验者,请每个实验者对某个编解码器的输出进行质量判分,采用类似于考试的五级分制,不同的MOS分对应的质量级别和失真级别见下表。,声音主观质量的度量方法,数字化声音,用声音录制软件记录的英文单词“Hello”的语音实际波形,模拟信号很容易受到电子干扰,因此随着技术的发展,声音信号就逐渐过渡到了数字存储阶段,A/D转换和D/A转换技术便应运而生。A:“Analog”(类比、模拟)D:“Digital”(数字、数码)A/D转换就是把模拟信号转
6、换成数字信号的过程,模拟电信号变为了由“0”和“1”组成的Bit信号。这样做的好处是显而易见的,声音存储质量得到了加强,数字化的声音信息使计算机能够进行识别、处理和压缩,这也就是为什么如今磁带逐渐被淘汰,CD唱片却趋于流行的原因。A/D转换的一个关键步骤是声音的采样和量化,得到数字音频信号,它在时间上是不连续的离散信号。,借助于A/D或D/A转换器,模拟信号和数字信号可以互相转换,8位可编程A/D转换芯片,数字音频的处理,声音的压缩,波形编码,常见方法:脉冲编码调制(PCM)、增量调制(DM)、差值脉冲编码调制(DPCM)、自适应差分脉冲编码调制(ADPCM)、子带编码(SBC)和矢量量化编码
7、(VQ)等。,编码信号的速率计算:编码速率采样频率编码比特数播放某音频信号所需存储量播放时间速率8(字节),参数编码,通过构造发声模型作为基础,用一套模拟声带频谱特性的滤波器系数和若干声源参数来描述这个模型,在发送端从模拟语音信号中提取各个特征参量并进行量化编码,以实现语音信息的数字化。优点:语音编码速率较低(29.6kbit/s),压缩比特率低;缺点:合成语音质量较差,实现的复杂度高。典型代表:线性预测编码器(LPC),语声信号产生模型,周期性信号,随机性信号,基音周期Tp,浊音,清音,线性时变滤波器,合成语音信号输出C(n),u(n),v(n),G增益控制,时变参数ai,混和编码,波形编码
8、:保真度好,计算量小,但编码后速率高;参数编码:码速率较低,但保真度欠佳,计算复杂。波形编码与参数编码结合混和编码:克服弱点,结合优点,压缩比特率:416kbit/s编码器:多脉冲激励线性预测编码器(MPE-LPC)、规则脉冲激励线性预测编码器(RPE-LPC)、码激励线性预测编码器(CELP)、矢量和激励线性预测编码器(VSELP)和多带激励线性预测编码器。,与参数编码的差别:信号激励源得选取更加精细通过调整激励信号使语音输入信号与重构的语音信号误差最小(合成分析法)。,三种压缩编码的性能比较,2,4,6,16,8,32,kbit/s,主观音质评价,混和法,参数法,波形法,54321,差值脉
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 09 音频 编码 技术
链接地址:https://www.31ppt.com/p-6614858.html