多媒体技术基础第版数字声音编码.ppt
《多媒体技术基础第版数字声音编码.ppt》由会员分享,可在线阅读,更多相关《多媒体技术基础第版数字声音编码.ppt(46页珍藏版)》请在三一办公上搜索。
1、多媒体技术基础(第3版)第3章 数字声音编码,林福宗清华大学 计算机科学与技术系2008年9月,3章 数字声音编码,2,第3章 数字声音编码目录,3.1 声音简介3.1.1 声音是什么3.1.2 声音的频率范围3.2 声音信号数字化3.2.1 从模拟过渡到数字3.2.2 模拟信号与数字信号3.2.3 声音信号数字化3.2.4 声音质量与数据率3.3声音质量的MOS评分标准3.4 脉冲编码调制(PCM)3.4.1 PCM的概念3.4.2 均匀量化3.4.3 非均匀量化3.5 PCM在通信中的应用3.5.1 频分多路复用3.5.2 时分多路复用3.5.3 数字通信线路的数据传输率,3.6 增量调制
2、与自适应增量调制3.6.1 增量调制(DM)3.6.2 自适应增量调制(ADM)3.7 自适应差分脉冲编码调制3.7.1 自适应脉冲编码调制(APCM)的概念3.7.2 差分脉冲编码调制(DPCM)的概念3.7.3 自适应差分脉冲编码调制(ADPCM)3.7.4 G.726 ADPCM编译码器3.8 G.722 SB-ADPCM编译码器3.8.1 子带编码(SBC)3.8.2 子带-自适应差分脉冲编码调制(SB-ADPCM)3.9 线性预测编码(LPC)的概念3.10 GSM声音简介3.11 话音编码标准摘要3.11.1 编码算法的性能3.11.2 话音编码标准参考文献和站点,3章 数字声音编
3、码,3,3.1 声音简介,声音是什么声音是听觉器官对声波的感知,而声波是通过空气或其他媒体传播的连续振动声音的强弱体现在声波压力的大小上,音调的高低体现在声音的频率上声音用电表示时,声音信号在时间和幅度上都是连续的模拟信号,如图3-1所示声波具有普通波所具有的特性,例如反射(reflection)、折射(refraction)和衍射(diffraction)等,图3-1 声音是一种连续的波,3章 数字声音编码,4,3.1 声音简介(续1),Audio是什么 Audio作名词声音 通常指频率在10 Hz和20 000 Hz范围里的声音The part of television or motio
4、n-picture equipment that has to do with soundThe broadcasting,reception,or reproduction of soundAudible soundA sound signal Audio作修词音频 修饰或说明人的听觉系统可感知的频率(1020 000 Hz)Relating to frequencies within the range of perception by the human ear from about 15 through 20,000 hertz(cycles per second).Of or rel
5、ating to humanly audible sound.Of or relating to the broadcasting or reception of sound.Of or relating to high-fidelity sound reproduction,3章 数字声音编码,5,3.1 声音简介(续2),练习:如何翻译下面的术语audio on demand音乐点播/声音点播digital audio数字声音 DVD-audio?streaming audio?audio streaming?MPEG audio?audio compression?声音的频率高保真声音(
6、high-fidelity audio):10 20 000 Hz声音(audio):20 20 000Hz话音(speech):3003000/3400 Hz亚音/次音(subsonic):20 000 Hz,3章 数字声音编码,6,3.2 声音信号数字化,数字化的概念采样和量化连续时间的离散化通过采样来实现,就是每隔相等的一段时间采样一次,这种采样称为均匀采样(uniform sampling)连续幅度的离散化通过量化(quantization)来实现,就是把信号的强度划分成一小段一小段,如果幅度的划分是等间隔的,就称为线性量化,否则就称为非线性量化。图3-2表示了声音数字化的概念,图3-
7、2 声音的采样和量化,3章 数字声音编码,7,3.2 声音信号数字化(续1),采样频率采样频率由根据奈奎斯特理论(Nyquist theory)确定奈奎斯特理论指出,采样频率不应低于声音信号最高频率的两倍,这样就能把以数字表达的声音还原成原来的声音,这叫做无损数字化(lossless digitization)假设被采样信号的最高频率为fmax,则采样定律可用公式表示为,读者可这样来理解奈奎斯特理论声音信号可看成是由许多正弦波组成的,一个振幅为A、频率为f的正弦波至少需要两个采样样本表示,因此,如果一个信号中的最高频率为fmax,采样频率最低要选择2 fmax。例如,话音信号的最高频率约为3.
8、4 kHz,采样频率就选为8 kHz,3章 数字声音编码,8,3.2 声音信号数字化(续2),采样精度度量声音波形幅度的精确程度,用每个声音样本的位数(即bps)表示例如每个声音样本用16位表示,测得的声音样本值是在065535范围里的数,它的精度是1/65536精度是在模拟信号数字化过程中度量模拟信号的最小单位,因此也称量化阶(quantization step size)01 V的电压用256个数表示时,量化阶等于1/256 V样本位数的大小影响到声音的质量,位数越多,声音质量越高,所需存储空间也越多;位数越少,声音质量就越低,所需存储空间也越少,3章 数字声音编码,9,3.2 声音信号数
9、字化(续3),采样精度的另一种表示方法是信号噪声比,简称为信噪比(signal-to-noise ratio,SNR),并用下式计算,其中,Vsignal表示信号电压,Vnoise表示量化噪声电压(模拟信号的采样值和与它最接近的数字数值之间的差值),SNR的单位为分贝(db),3章 数字声音编码,10,3.2 声音信号数字化(续4),声音质量和数据率 质量度量,*电话使用m律编码,动态范围为13位,压缩后的样本精度为8位,3章 数字声音编码,11,3.3 声音质量的MOS评分标准,声音质量的衡量方法声音带宽法等级由高到低依次是DAT、CD、FM、AM和数字电话客观质量度量用信噪比(SNR)表示
10、,详细计算请参看林福宗和陆达编写的多媒体与CD-ROM,1995.3清华大学出版社出版主观质量度量度量方法类似于电视节目中的歌手比赛,由评委对每个歌手的表现进行评分,然后求出平均值 有时同时采取两种方法评估,有时以主观质量度量为主,3章 数字声音编码,12,3.3 声音质量的MOS评分标准(续),主观平均分(mean opinion score,MOS)对声音主观质量度量比较通用的标准是5分制,各档次的评分标准见表3-2,表3-2 声音质量MOS评分标准,3章 数字声音编码,13,3.4 脉冲编码调制(PCM),脉冲编码调制(PCM)的概念 PCM是pulse code modulation的
11、缩写概念上最简单、理论上最完善、最早研制成功、使用最为广泛、数据量最大的编码系统,图3-3 PCM编码原理框图,3章 数字声音编码,14,3.4 脉冲编码调制(续1),在图3-3中输入是模拟信号,输出是PCM样本。防失真滤波器:低通滤波器,用来滤除声音频带以外的信号波形编码器:可理解为采样器量化器:可理解为“量化阶大小(step-size)”生成器或者称为“量化间隔”生成器PCM实际上是模拟信号数字化 模拟声音数字化的两个步骤:第一步是采样,就是每隔一段时间间隔读一次声音的幅度第二步是量化,就是把采样得到的声音信号幅度转换成数字值,3章 数字声音编码,15,3.4 脉冲编码调制(续2),量化的
12、方法主要有均匀量化和非均匀量化均匀量化采用相等的量化间隔/等分尺度量采样得到的信号幅度,也称为线性量化。量化后的样本值Y和原始值X的差E=Y-X称为量化误差或量化噪声,图3-4 均匀量化,3章 数字声音编码,16,3.4 脉冲编码调制(续3),非均匀量化大的输入信号采用大的量化间隔,小的输入信号采用小的量化间隔可在满足精度要求的情况下用较少的位数来表示声音数据还原时,采用相同的规则采样输入信号幅度和量化输出数据之间定义了两种对应关系律压扩算法A律压扩算法注:压扩(companding),图3-5 非均匀量化,3章 数字声音编码,17,3.5 PCM在通信中的应用,时分多路复用 PCM编码早期主
13、要用于话音通信中的多路复用时分多路复用是在同一条通信线路上使用不同时段“同时”传送多个独立信号的通信方法时分多路复用的核心思想是将时间分成等间隔的时段,为每对用户指定一个时间间隔,每个间隔传输信号的一部分例如,话音信号的采样频率f8000 Hz/s,它的采样周期125 s,这个时间称为1帧(frame)。在这个时间里可容纳的话路数有两种规格24路制30路制,3章 数字声音编码,18,3.5 PCM在通信中的应用(续1),24路制的重要参数如下:每秒钟传送8000帧,每帧125s12帧组成1复帧(用于同步)。每帧由24个时间片(信道)和1位同步位组成每个信道每次传送8位代码,1帧有24 8 11
14、93位(位)数据传输率R80001931544 kb/s每一个话路的数据传输率80008=64 kb/s,图3-6 24路PCM的帧结构,3章 数字声音编码,19,3.5 PCM在通信中的应用(续2),30路制的重要参数如下:每秒钟传送8000帧,每帧125 s16帧组成1复帧(用于同步)每帧由32个时间片(信道)组成每个信道每次传送8位代码数据传输率:R80003282048 kb/s每一个话路的数据传输率80008=64 kb/s 线路利用率使用时分多路复用技术时,由于当信道无数据传输时仍给那个信道分配时间槽,因此线路利用率较低为解决这个问题,开发了统计时分多路复用技术(statistic
15、al time division multiplexing,STDM)。STDM是按照每个传输信道的传输需要来分配时间间隔的时分多路复用技术,可提高传输线路的效率,3章 数字声音编码,20,3.5 PCM在通信中的应用(续3),数字通信线路的数据传输率 为反映PCM信号复用的复杂程度,通常用“群(group)”这个术语来表示,也称为数字网络的等级传输容量由一次群(基群)的30路(或24路),增加到二次群的120路(或96路),三次群的480路(或384路),图3-7表示二次复用的示意图。图中的N表示话路数,无论N30还是N24,每个信道的数据率都是64 kb/s,经过一次复用后的数据率就变成2
16、048 kb/s(N30)或1544 kb/s(N24)在数字通信中在北美,具有1544 kb/s数据率的线路叫做“T1远距离数字通信线路”,提供这种数据率的服务级别称为T1等级在欧洲,具有2048 kb/s数据率的线路叫做“E1远距离数字通信线路”,提供这种数据率的服务级别称为E1等级T1/E1,T2/E2,T3/E3,T4/E4和T5/E5的数据传输率见表3-3,3章 数字声音编码,21,3.5 PCM在通信中的应用(续4),时分多路复用示意图,图3-7 二次复用示意图,3章 数字声音编码,22,3.5 PCM在通信中的应用(续5),T1/E1,T2/E2,T3/E3,T4/E4和T5/E
17、5的数据传输率,注:在ITU的文件中,数据率用kb/s和Mb/s做单位,因此该表没有用kbps和Mbps做单位,3章 数字声音编码,23,3.6 增量调制与自适应增量调制,增量调制也称调制(delta modulation,DM),是一种预测编码技术对实际的采样信号与预测的采样信号之差的极性进行编码。如果实际的采样信号与预测的采样信号之差的极性为“正”,则用“1”表示;相反则用“0”表示,或者相反由于DM编码只须用1位对话音信号进行编码,所以DM编码系统又称为“1位系统”比较:PCM是对每个采样信号的整个幅度进行量化编码,图3-8 DM波形编码示意图,3章 数字声音编码,24,3.6 增量调制
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多媒体技术 基础 数字 声音 编码
链接地址:https://www.31ppt.com/p-6456560.html