[信息与通信]语音压缩方法综述.ppt
《[信息与通信]语音压缩方法综述.ppt》由会员分享,可在线阅读,更多相关《[信息与通信]语音压缩方法综述.ppt(79页珍藏版)》请在三一办公上搜索。
1、语音压缩方法综述,巩永稳,主要内容,语音压缩技术导论编码方式分类波形编码(PCM、DPCM、AD-PCM)参数编码混合编码,语音压缩:,语音信号是模拟信号,不能直接在数字通信系统中传输,必须先进行模/数转换,再进行数/模转换,并且为了降低编码速率和提高语音质量而采用的一些优化编码技术等这一系列语音编码过程叫做语音压缩。,对语音压缩的要求:,编码速率要适合在常用语音信道内传输,一般要求编码速率在162kb/s范围内的情况较多。在一定编码速率下,语音质量应尽可能高,即译码后恢复语音的保真度要尽量高。编译码时延要小,总时延一般不要大于65ms。编译码算法复杂度不能太大,以适于用大规模集成电路实现。坚
2、韧性要好,有较好的抗误码性能。,语音编码的意义:,提高通话质量(数字化+信道编码纠错)提高频谱利用率(低码率编码)提高系统容量(低码率、语音激活技术),语音压缩系统构成:,编码速率:编码速率可以用“比特/样点”(b/p)表示,它代表了平均每个语音样点用多少比特编码,一般用R表示。也可用“比特/秒”(b/s)来度量,它代表了编码的总速率,一般用V表示,则V和R可以通过取样频率联系起来:V=R*Fs其中Fs为取样频率,坚韧性:所谓坚韧性是指语音编码能够适应各种使用环境和条件,在较为不利的环境和条件下能正常工作。,主要内容,语音压缩技术导论编码方式分类波形编码(PCM、DPCM、AD-PCM)参数编
3、码混合编码,语言编码的分类:,波形编码:将时域模拟话音的波形信号经过采样、量化和编码形成数字语音信号。编码速率较高:16k64k。包括:PCM、ADPCM、M、CVSDM、APC等。占用较高带宽,适合有线。参量编码:基于人类语音的产生机理建立数学模型,根据输入语音得出模型参数并传输,在收端恢复。编码速率较低:1.2k4.8kbps。包括各种线性预测编码(LPC)方法和余弦声码器等。语音质量中等,不满足商用要求。混合编码:波形编码+参量编码(LPAS)包括GSM的RPE-LPC编码和VSELP编码。,语音编码的分类:,主要内容,语音压缩技术导论编码方式分类波形编码(PCM、DPCM、AD-PCM
4、)参数编码混合编码,1、均匀量化PCM 直接对语音信号进行A/D转换。语音波形信号就被表示成一组用数字编码的脉冲序列。这种编码方法被称为脉冲编码调制(Pulse Coding Modulation,简称PCM)。,PCM编码原理如下图所示。,模数转换要经过抽样、量化和编码三个步骤。,抽样是把连续时间模拟信号转换成离散时间连续幅度的抽样信号。量化是把离散时间连续幅度的抽样信号转换成离散时间离散幅度的数字信号。编码是将量化后的信号编码形成一个二进制码组输出。,A/D变换,PAM,量化,量化的过程是将信号转换成离散时间离散幅度的多电平信号。,PCM转换过程举例,原始信号,PAM脉冲,PCM 脉冲(有
5、量化误差),011100011011001100,PCM 输出,抗混叠滤波:工程测量中采样频率不可能无限高也不需要无限高,因为一般只关心一定频率范围内的信号成份。为解决频率混叠,在对模拟信号进行离散化采集前,采用低通滤波器滤除高于1/2采样频率的频率成份。(20-20000HZ),量化误差e(n)可以定义如下:其中 为量化后的信号,为量化前的采样信号。量化误差也称为量化噪声。对于均匀量化来说,量化噪声的功率仅取决于量化间隔。,假设量化误差e(n)在各个量化间隔的区间里均匀分布,则由于引入量化噪声,所得数字语音的信噪比为:,分别表示输入信号和量化噪声的方差或能量,为信号的最大幅度,B表示量化字长
6、。,根据语音的分布统计特性,可以取,可以计算出当B=12时,采样频率8kHz的均匀量化器所产生的数字语音的信噪比可达60dB,基本上可以满足高质量的电话通信要求。此时PCM的编码速率为96kbit/s。,2、非均匀量化 PCM在语音信号中,样本的幅度值不是均匀分布的,信号大量地集中在小幅度值上。如果对小幅度样本使用小的量化间隔,进行精确量化,而对大幅度样本使用大的量化间隔,则既可成功地提高信噪比,又可避免大信号的过载。,最常用的非均匀量化方法是对数压扩方法。编码时,利用语音信号的幅度统计特性,对幅度按对数变换进行压缩,然后再进行均匀量化。如 律变换、A律变换等。,设 为语音波形的采样值,则 律
7、压缩定义为:,即将输入语音压缩变换为,然后再进行均匀量化编码。,A律的压缩方法与 律相似,按如下公式进行:,目前,非均匀量化的PCM编码广泛地应用在数字电话网中,北美和日本主要使用 律压缩,我国则采用A律压缩。,FA(x),0,1,1,7/8,6/8,5/8,4/8,3/8,2/8,1/8,xa(nT),A律压扩编码,采用8位二进制编码:C7C6C5C4C3C2C1C0C7:表示信号的极性,称为极性码。0为正,1为负。,C3C2C1C0:表示每一段落的16个均匀划分的量化级,称为段内码。0000 0001 0010 0011 0100 0101 0110 0111 1000 1001 1010
8、 1011 1100 1101 1110 1111,C6C5C4:表示段落序号,称为段落码。000 001 010 011 100 101 110 111,对输入动态范围为(-5v,+5v),用A律压扩编码,有:,1/128 0.0390625v,76543210,1 5v,1/2 2.5v,1/4 1.25v,1/8 0.625v,1/16 0.3125v,1/32 0.15625v,1/64 0.078125v,0 0v,输入信号为1.05v,则编码为:极性码:0 段落码:101段内码:=(1.25-0.625)/16=0.0390625(1.05-0.625)/=10.88取整数10,对
9、应第10量化间隔,编码为1010最后完整的码字为:01011010,主要内容,语音压缩技术导论编码方式分类波形编码(PCM、DPCM、AD-PCM)参数编码混合编码,3、自适应量化PCM,由于语音信号的特性是随时间变化的,能量时大时小,因此可以采用自适应的方法。对短时能量较大的信号,采用较大的量化间隔进行量化,相反地,对短时能量较小的信号,采用较小的量化间隔进行量化。这样无疑有助于减少量化噪声,提高量化后信号的信噪比。,差分编码调制,问题的提出 DPCM的基本原理 DPCM的特点 DPCM的实际应用,问题的提出,PCM编码速率64kb/s才能符合传输话音的质量指标,每路电话占用频带大于模拟单边
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息与通信 信息 通信 语音 压缩 方法 综述
链接地址:https://www.31ppt.com/p-2238623.html