第二章语音信号的压缩编码课件.ppt
《第二章语音信号的压缩编码课件.ppt》由会员分享,可在线阅读,更多相关《第二章语音信号的压缩编码课件.ppt(94页珍藏版)》请在三一办公上搜索。
1、第2章,信源编码,1,PPT课件,补充: 数据压缩简介,PCM码率:采样率值采样大小值声道数 bps。PCM数字电话的数码率为64kb/s; 视频:如320233窗口中,以25帧/秒速度播放1分钟颜色数为8bit的视频信号,其数据量为: 320 233 82560/(81024 1024) 107(M) 对一首长约4分钟的歌曲采样,将其存储在磁盘上,以CD音质的WAV格式抽样,抽样率为44.1kHz,即每秒钟接收44100个值,立体声,每次抽样数据为16位(2字节),则这首歌占的空间为:44100 x2声道x16bitx60秒x4分钟=40.4MB 如果下载传输率为56kbps,则下载时间为:
2、 40.4x106x8/56x103x60= 96分钟 即使是1M的宽带网也需5分钟以上。,2,PPT课件,1、无损压缩,所谓无损压缩格式,是利用数据的统计冗余进行压缩,可完全回复原始数据而不引起任何失真,但压缩率受到数据统计冗余度的理论限制,一般为2:1到5:1.这类方法广泛用于文本数据,程序和特殊应用场合的图像数据(如指纹图像,医学图像等)的压缩。目前比较出名的无损压缩格式有APE、FLAC、LPAC、WavPack、TTA ; PNG 、TIFF 、JPEG 2000;,无损压缩格式的优势:1、100的保存、没有任何信号丢失 2、音质高,不受信号源的影响 3、转换方便,3,PPT课件,2
3、、有损压缩,有损数据压缩方法是经过压缩、解压的数据与原始数据不同但是非常接近的压缩方法。这种方法经常用于因特网尤其是流媒体以及电话领域。通过在用户的忍耐范围内损失一些精度,我们可以把图像(也包括音频和视频)压缩到原大小的十分之一、百分之一甚至千分之一,这远远超出了通用压缩算法的能力极限。 举例 jpeg和bmp,4,PPT课件,应用,图像压缩 :分形压缩/JPEG/JPEG2000视频压缩:H.261 /H.263 /H.264/MPEG-1 /MPEG-2 /MPEG-4音频压缩 :MP2 /MP3 /AAC /ADPCM /G.711 / G.726,5,PPT课件,本章内容,2.1 模拟
4、信号的数字化2.2 语音编码技术波形编码参数编码 混合编码2.3图像编码图像信号及其数字化数字图像压缩编码图像压缩编码标准,6,PPT课件,2.2.2 语音信号的波形编码,脉冲编码调制(PCM)自适应差分脉冲编码调制(ADPCM)DPCM的基本原理自适应量化自适应预测ADPCM编译码系统,子带编码(SBC)子带编码原理;子带传输速率的计算;子带的划分方法;正交镜象滤波器,7,PPT课件,DPCM的基本原理,1.差值脉冲编码调制的概念2.DPCM的系统原理框图3.极点与零点预测4.预测增益,8,PPT课件,一般PCM对样值信号编码都是按照样值幅度独立进行,每一编码码组允许的信号动态范围就是原信号
5、的动态范围,它比较大,需要较多编码位数。任何信号,不论语音或图像,采用直接采样-量化-编码的方式进行编码,都会发现码组之间具有很强的相关性.由于相关性的存在,传输数据中存在大量不需要传输的信息,称为冗余.,1.差值脉冲编码调制( Differential Pulse Code Modulation )的概念,9,PPT课件,差值脉冲编码调制(DPCM)就是考虑利用信号相关性找到可以反映信号变化特征的一个差值进行编码。(通过预测和差值编码方式来减少冗余,实现数据压缩的目的) 编码: 对信号实际值和预测值的差值进行量化编码并传输. 译码: 接收端将接收到的差值和恢复的预测值相加得到此次采样值. 由
6、于只传输动态范围较小的差值,所以编码的码组不需太长,在DPCM中,一般采用4位.数码率为8k*4bit=32kbps,10,PPT课件,1)预测: 指当知道有冗余性(相关性)信号的一部分时就可以对其余部分进行推断和估计。(通过前几次的样值来预测后一次的样值),假如有一个信号x(t),用速率1/TS进行采样,那么在时刻t=nTs,我们可以掌握此前N个样值序列 x(nTs-Ts), x(nTs-2Ts),x(nTs-NTs),根据前N个样值对x(nTs)进行预测,定义为:,Wi-加权常数,可为常数或变量,-x(nTs)的预测值。,11,PPT课件,预测过程可用横截滤波器实现,12,PPT课件,在每
7、个抽样时刻到来时,滤波器输出将会给出下一个样值的预测值。注意:预测值与实际值并不相同。,所谓差值脉冲编码就是对真正样值x(nTs)与以过去样值为基础得到的估计值 之间的差值进行量化和编码。,13,PPT课件,2、DPCM的系统原理框图,后向序贯自适应预测算法,量化后的差值,输入端抽样信号,接收端重建信号,预测信号,DPCM输出码字,差值,14,PPT课件,编码器和译码器中的预测器应完全相同。DPCM的总量化误差定义为,根据原理框图:,DPCM系统总量化误差只和差值信号的量化误差有关。图3.1.3说明了预测原理,15,PPT课件,举例:4-DPCM系统编码器,量化器特性,试分别画出 的c(n)波
8、形,编码器特性,16,PPT课件,线性预测网络可分为极点预测器和零点预测器两种(1)极点预测器(即采用重建信号 进行的预测),3.极点与零点预测,设发送系统预测器传递函数为P(Z),17,PPT课件,式中 是一组预测系数。,由于重建滤波器传递函数只有极点没有零点, 故称为全极点预测器.,18,PPT课件,(2)零点预测器(即采用重建信号 进行的预测),重建滤波器的传递函数只有零点没有极点,称为全零点预测器。,19,PPT课件,(3)极零点预测器(把零点和极点预测器组合起来),有零点有极点,称为极零点预测器,20,PPT课件,系统信噪比定义为:,=,=,量化器的量化信噪比,GP1,GP1,加预测
9、器后反而不利,4.预测增益,预测器增益,预测器有增益,21,PPT课件,要使信号总信噪比大,就要使预测增益大,也就是使差值d(n)减小,增加预测的准确性;同时还要求降低e(n),达到最佳量化. 只有采用自适应系统,才能得到最佳性能。有自适应系统的DPCM称为ADPCM(自适应差值脉码调制),22,PPT课件,二、 自适应量化,1、最佳量化 用均方误差D衡量量化器对x带来的损伤 使D最小的量化特性为最佳量化特性 y(n)有N个可能的取值,可变为,23,PPT课件,说明:1)最佳判决电平在相邻量化电平中心上 2)量化电平在相应间隔的功率密度函数的重 心上,24,PPT课件,高斯分布,非均匀量化器最
10、佳值,25,PPT课件,介绍以下两种方式: 1)前向自适应量化: 严格根据输入方差确定量化器分级判决电平xk与量化器的量化电平yk值,称为前向自适应。 这种方法在实时系统不易实现。,2.自适应量化自适应量化指量化器的量化间隔(阶距)能随信号的瞬时值作自适应调整,以达到最佳量化。为使量化器始终处于最佳状态或接近最佳状态,量化器参数(量化电平yk、分级判决电平xk、量阶)能够自适应差值信号d(n)变化。,26,PPT课件,2)后向自适应量化 根据前一时刻的输出数字码C(n-1)或量化器输出值y(n-1)来确定本次x(n)与y(n),称为后向自适应。 Jayant提出的一码字后向自适应算法:根据离量
11、化器最近的Rbit码字,确定现在的量阶(n)。,已知:,现在量阶,第(n-1)时刻 幅度I的函数,与此时量化电平有关,已知量阶,27,PPT课件,原教材图3.1.8 一码字记忆3bit自适应量化,28,PPT课件,1、最佳线性预测器 预测器具有一组预测系数 , ,怎样选择这一组数据,使预测值更接近实际值,使差值功率Ed2 (n) 最小,实现GP和SNR的最大,是最佳预测器所要解决的问题。,三、 自适应预测,29,PPT课件,1)一阶固定线性预测 假定一阶预测,即,30,PPT课件,2)二阶固定预测器,除去 之外,二阶预测的误差总比一阶预测的小,31,PPT课件,8KHz抽样的语音信号(带通滤波
12、)的相关系数,32,PPT课件,作业题,1、已知一阶固定的DPCM系统,其预测系数h1=1,归一化相关系数p1定义为:其中 为相关系数,求该系统的预测增益Gp。,2、上题中若取一阶预测系数h1=h1opt,试求 Gpopt,Gp=1/2(1-0.825)=2.8571,h1=p1 Gp=3.13,33,PPT课件,求偏微分,并令为零,3)N阶最佳线性预测 最佳线性预测器是均方预测误差最小的预测器,可获得最大预测增益GP和最大信噪比。,34,PPT课件,所以得到一组线性方程,35,PPT课件,差值信号在预测系数取最佳值时最小,有,最佳预测增益,36,PPT课件,4)GP与预测阶数的关系 预测通常
13、要选用前多少次的样值来参与,见下图,当阶数大于2时,最佳预测增益就趋于饱和,饱和值一般为6-12dB,37,PPT课件,2、 自适应预测,为了获得最大的预测增益,通常采用自适应预测方式,预测系数在预测过程中实时调整.前向自适应预测算法,后向序贯自适应预测算法 最佳预测系数是根据量化后的编码数据x(n)进行估值,可以快速修正系数。如果由一个样值至一个样值逐个修正则称为序贯后向自适应预测。 推导过程:搜索底部顶点的过程(利用梯度),图3.1.10,38,PPT课件,梯度算法,梯度法中,按样值顺序逐个重新调整n时刻给定的矢量h(n),每次的调整量正比于梯度估值的负数。,均方差期望梯度估值矢量,调整步
14、长,常数,39,PPT课件,四、32kbit/s的ADPCM编译码系统,ADPCM技术指标:满足G.712的语音质量要求;经4次音频转换后MOS应大于3.5分;在Pe小于1e-3下能稳定工作ADPCM主要改进:量化器和预测器均采用自适应方式。抽样频率为8KHz,每一样值编4位码。,ADPCM编译码器原理框图 P99,40,PPT课件,自适应量化自适应预测(6个零点和2个极点),编码器,41,PPT课件,译码器,42,PPT课件,子带编码,(1)子带编码原理(2)子带传输速率的计算(3)正交镜象滤波器(4)子带的划分方法(5) 子带编码举例,43,PPT课件,1、子带编码原理,子带编码(SBC,
15、Sub-band Coding)是一种在频率域中进行数据压缩的方法。,44,PPT课件,编码器,PCM,工作原理图,45,PPT课件,在接收端,首先把码流分成与原来的各子带信号相对应的子带码流,然后解码、将频谱搬移至原来的位置,最后经带通滤波、相加,得到重建的信号。,解码器,46,PPT课件,对每个子带分别编码的好处,(1)可以利用人耳(或人眼)对不同频率信号的感知灵敏度不同的特性,在人的听觉(或视觉)不敏感的频段采用较粗糙的量化,从而达到数据压缩的目的。 例如:音调和共振峰,用较小的量化阶、较多的量化级数,即分配较多的比特数来表示样本值。 而话音中的摩擦音和类似噪声的声音,通常出现在高频子带
16、中,用较大量化阶距,分配较少的比特数。,47,PPT课件,(2)每个子带使用独立的量化阶距,这就可以避免能量较小的频带内的信号被其他频带中的量化噪声所掩盖。 (3)通过频带分裂,各个子带的取样频率可以成倍下降。,16kbps SBC,26.5kbps ADPCM,9.6kbps SBC,19kbps ADM,Mp3编码器,48,PPT课件,2、传输速率,在子带编码中,若各个子带的带宽Wk是相同的,则称为等带宽子带编码,否则,称为变带宽子带编码。,假设每个子带波形抽样为fsk,每个抽样用Rk比特编码,则总的传输速率等于每个子带的编码比特率的总和。,在等带宽子带编码中,式中W为总带宽,单位是赫兹;
17、M为子带的数目,49,PPT课件,由于第k个子带的抽样率为 ,则总传输速率简化为:,上式为等带宽分割时的传输率。 如果将总比特数表示为,则,这是全带编码时的传输速率表示式,R为对全带采样编码 时的平均比特数。,50,PPT课件,例题,一个4子带的SBC系统,子带分别为0800,8001600,16002400,24003200,如果忽略同步码的边带信息,子带的比特分配分别为3,2,1,0 比特/样值,求总的传输速率和全带采样时的平均比特数。,51,PPT课件,正交镜象滤波器(QMF)是数字滤波器中的一种特殊的新型滤波系统,它由一个低通滤波器和一个与其正交的镜象高通滤波器构成,其最大优点是在对信
18、号进行滤波选抽分解和反滤波插值重构时不会产生因频率混叠而带来的信号失真。 由于分割频带所用的滤波器不是理想的滤波器,经过分带、编码、译码后合成的输出音频信号会有混迭效应。采用正交镜象滤波器来划分频带,混迭效应在最后合成时可以抵消。,3、正交镜象滤波器,52,PPT课件,QMF简化的幅频特性,53,PPT课件,图中,用QMF把全带音频信号分割成两个等带宽子带。hH(n)和hL(n)分别表示高通滤波器和低通滤波器,它们组成一对正交镜象滤波器。这两个滤波器也叫做分析滤波器。,用正交镜象滤波器分割频带的子带编译码简化框图。,54,PPT课件,4、子带的划分,根据各频段对主管听觉贡献相等的原则作合理分配
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第二 语音 信号 压缩 编码 课件
链接地址:https://www.31ppt.com/p-1526978.html