(毕业设计)多制式语音编码及其DSP实现.doc
《(毕业设计)多制式语音编码及其DSP实现.doc》由会员分享,可在线阅读,更多相关《(毕业设计)多制式语音编码及其DSP实现.doc(36页珍藏版)》请在三一办公上搜索。
1、编号 本科毕业设计多制式语音编码及其DSP实现Multi-standard speech coding and DSP Implementation摘 要介绍了一种多制式语音编解码器,在单片TMS320VC5409上完成4路话音的全双工通信,并实现G.729a、CVSD、ADPCM算法之间的编码转换,给出了算法的软硬件实现、算法的运算量及所占用的硬件资源。语音通信在现代通信中占有重要地位,它研究的是语音信号的高效、高质量传输的问题,包括语音编码、语音加密等内容。虽然语音通信仅研究对语音信号进行压缩传输等内容,在理论上比语音合成与语音识别简单,但是这一领域仍然存在很多需要解决的问题,而且这项技术
2、仍处于不断发展之中。关键词:多制式语音编解码 TMS320VC5409 G.729a CVSD ADPCMABSTRACTIntroduced a multi-standard voice codecs, a single TMS320VC5409 to complete the four-way full-duplex voice communication, and to achieve G.729a, CVSD, ADPCM algorithm between the encoding conversion, the algorithm is given the hardware and
3、 software to achieve , The algorithm for computing capacity and occupied by the hardware resources.Voice communications in modern communication occupies an important position, it is the voice signal on the efficient, high-quality transmission problems, including voice coding, voice encryption, and o
4、ther content. Although voice communications only on the compressed voice signal transmission, etc., in theory than voice synthesis and voice recognition simple, but there are still many areas that need to resolve the issue, but the technology is still in continuous development.Key words: Multi-stand
5、ard voice codecs TMS320VC5409 G.729a CVSD ADPCM目 录第一章 绪论.11.1 引言.11.2 三种语音编码简介.21.3 论文研究目的和内容.4第二章 语音编码的设计.52.1 G.729a算法.52.2 ADPCM算法.92.3 CVSD算法.11第三章 芯片和硬件系统设计.143.1 DSP芯片TMS320VC540912.14 3.2 硬件系统.153.3 硬件系统的调试.21第四章 软件系统设计与调试及算法修正.234.1 CVSD算法的修正.234.2 G.729算法的回声抵消模块.244.3 储存区的优化.244.4 代码的优化.254
6、.5 软件的调试.25第五章 多制式语音编码的发展前景.27结论.29参考文献.30致谢.32第一章 绪 论1.1引言语音通信在现代通信中占有重要地位,它研究的是语音信号的高效、高质量传输的问题,包括语音编码、语音加密等内容。虽然语音通信仅研究对语音信号进行压缩传输等内容,在理论上比语音合成与语音识别简单,但是这一领域仍然存在很多需要解决的问题,而且这项技术仍处于不断发展之中。语音编码的目的是在保持可以接受的失真的情况下采用尽可能少的比特数表示语音。如果对语音直接采用模/数变换技术编码,则传输或储存语音的数据量太大。为了降低传输或存储的费用,就必须对其进行压缩。各种编码技术的目的就是为了减少传
7、输码率或存储量,以提高传输或存储的效率。在这里,传输码率就是指传输每秒钟语音信号所需要的比特数,也称数码率。经过这样的编码之后,同样的信道容量能传输更多路的信号,如用于存储则只需要较小容量的存储器,因而这类编码又称为压缩编码。实际上,压缩编码需要在保持可懂度与音质、降低数码率和降低编码过程的计算代价三方面折衷。经过语音的压缩编码后,可以得到低数码率的语音。低数码率的语音具有以下优点:1、它可以在窄带信道(例如3kHz模拟电话线路和高频无线电信道)上传输。采用低数码率的语音编码率的语音编码技术,有效地适应了信号电缆带宽窄的特点。2、更能克服信道失真,这意味着可以采用比较简单的调制解调器3、在大多
8、数信道中,当误码率给定时,低数码率比高数码率所需要的发射功率更小。4、给定容量的复接电路或者复按电路网络允许通过更多的信道。5、为了存储一定的语音所需要的存储器容量将更少。6、当和差错纠正与扩频技术结合使用时,将具有更大的抗噪声与抗干扰能力1。语音压缩编码,按照编码后传输所需的数据率来分,可以分为高速率(32kb/s以上)、中高速率(1632kb/s)、中速率(4.816kb/s)、低速率(1.24.8kb/s)、和极低速率(1.2kb/s以下)五大类。语音编码方法,按照传统的概念可分为三类:波形编码、参数编码(声码器)、和混合编码。波形编码技术以尽可能重构译音波形为原则进行数据压缩,即在编码
9、端以波形逼近为原则对语音信号进行压缩编码,解码端根据这些编码数据恢复出语音信号的波形。它具有语音质量好、抗噪声性能强等特点,但所需的编码速率高,一般在6416kb/s之间。而参数编码即声码器技术则从听感个角度注重语音本身的重现。它通过对语音信号进行分析,提取参数来对参数进行编码,在接受端能够用解码后的参数重构语音信号,从而让解码语音听起来与输入语音是相同的,而不是保证其波形相同。参数编码一般对数码率的要求比波形编码低的多。缺点是语音音质较差,而且对噪声较敏感、顽健性(指在实验室相对安静环境下训练好的系统,当用在与训练环境不匹配的实际环境时性能下降的程度)不够好。混合编码是上述两种方法的有机结合
10、,同时从两个方面构造语音编码:一方面增加语音的自然度,提高语音质量;另一方面对于波形编码实现较低的数码率指标。由于近年来在语音编码技术研究中,尤其是中、低速率编码技术中,各种新算法、新概念的不断涌现,采用上述概念进行分类的界限已经显得越来越模糊了。1.2 三种语音编码简介在各种通信设备中,实时的语音压缩通常在DSP上实现。单一编码算法,由于码率和算法固定,系统的灵活性较差。越来越多的通信服务要求能实现多种、多路编码算法,提供一定范围内的编码速率和编码算法的多种选择,例如软件无线电、IP电话、多媒体终端等。G.729a是ITU制定的一种高质量的中速率语音压缩编码标准,编码速率为8kbps,目前已
11、在许多通信系统中得到了应用。国际电信联盟(ITU)于1995年11月正式通过了G.729。 ITU建议G.729也被称作“共轭结构代数码本激励线性预测编码方案”(CS-ACELP),它是当前较新的一种语音压缩标准。G.729是由美国、法国、日本和加拿大的几家著名国际电信实体联合开发的。它需要符合一些严格的要求,比如在良好的信道条件下要达到长话质量,在有随机比特误码、发生帧丢失和多次转接等情况下要有很好的稳健性等。这种语音压缩算法可以应用在很广泛的领域中,包括电话、无线通信、数字卫星系统和数字专用线路。G.729算法采用“共轭结构代数码本激励线性预测编码方案”(CS-ACELP)算法。这种算法综
12、合了波形编码和参数编码的优点,以自适应预测编码技术为基础,采用了矢量量化、合成分析和感觉加权等技术。1996年ITU又制定了G.729的简化方案G.729a,主要降低了计算的复杂度以便于实时实现,因此目前使用的都是G.729a46。CVSD(连续可变斜率增量调制)是一种抗信道误码非常好的语音编码算法,擅长处理丢失和被损坏的语音采样,即使比特错误率达到4%,CVSD编码的语音还是可听的。CVSD编码器在低于24kb/s时,语音质量较优,主要是颗粒噪声低、听起来比较清晰。但在16kb/s是其语音质量又较低。40kb/s以上时,可有优等长话的语音质量。因此在军事通信、宇航通信、蓝牙无线技术等方面中得
13、到广泛应用。CVSD的量化步长是可动态调节的,它通过对输入信号的振幅变化率来调节量化步长的增量值,当输入信号的振幅变化率增大时,增量值也相应增大,反之亦然。因此它能在较大的动态范围内,始终使信号的量化信噪比接近于其最大值,对输入的原始信号进行准确的跟踪、量化及编码,从而拥有很高的信号保真度,有效地提高了语音编码的质量。ADPCM(自适应差分脉冲编码调制)是一种算法较简单的波形编码,是一种针对 16bits( 或8bits或者更高) 声音波形数据的一种有损压缩算法。它的核心思想是:利用自适应改变量化阶的大小,即使用小的量化阶去编码小的差值,使用大的量化阶去编码大的差值,使用过去的样本值估算下一个
14、输入样本的预测值,使实际样本值和预测值之间的差值总是最小。ADPCM记录的量化值不是每个采样点的幅值,而是该点的幅值与前一个采样点幅值之差。它将声音流中每次采样的 16bit 数据以 4bit 存储,所以压缩比 1:4. 而且压缩/解压缩算法非常简单,所以是一种低空间消耗,高质量高效率声音获得的好途径。8bits采样的声音人耳是可以勉强接受的,而 16bit 采样的声音可以算是高音质了。ADPCM算法却可以将每次采样得到的 16bit 数据压缩到 4bit。ADPCM主要是针对连续的波形数据的,保存的是波形的变化情况,以达到描述整个波形的目的,但是它的编码和解码的过程却很简洁。因此它具有良好的
15、话音质量和抗噪性能,在卫星通信、数字话路倍增系统中得到了广泛应用。综合了这三种算法的编码系统,在8kbps32kbps码率具有较高的灵活性,在实际生产中也将会有广泛的应用。1.3 论文研究目的和内容论文通过对G.729a、CVSD、ADPCM三种语音编码和TMS320VC5409DSP芯片做简单介绍后,对算法的软件和硬件实现进行解释,分析算法的复杂度,并给出算法所需运算量以及所占用的硬件资源。使其可以实现在单片TMS320VC5409上完成4路语音的全双工通信,并实现G.729a、CVSD、ADPCM算法之间的编码转换。最后得出三种算法可以在芯片上完成工作的结论。第二章 语音编码的设计2.1
16、G.729a算法G.729a 标准算法的大致流程是:在编码端,输入8KHz 采样的16 位线性PCM 语音信号,以80 个样值为单位(10ms一帧)进行编码,每帧又分为两个子帧(分别为5ms),CS-ACELP 编码器是基于码激励线性预测模型参数(包括线性预测器滤波器参数、自适应码本和固定码本索引与增益,一帧信息的参数量为80bit)的,这些参数经编码后传输出去。解码端对接收到的编码参数进行解码,重新获得激励和合成滤波器参数并重建语音。G.729a的编码过程:首先,对模拟输入语音信号经话路带宽滤波(符合ITU G.712建议)后,被以8kHz为采样频率进行采样,再量化成16bit线性PCM(脉
17、冲编码调制)数字信号输入到编码器。如图2.1所示。其主要部分有:1预处理语音信号先进入预处理模块,信号经过高通滤波和信号幅度衰减后,再作为后续模块分析的信号。2线性预测分析与LPC系数的量化首先对信号进行加线性预测分析窗,分析窗由两部分组成。第一部分是半个汉明窗,第二部分是四分之一个余弦信号。将加窗后的语音信号通过Levinson-Durbin算法获得线性预测滤波器系数ai , i=1.10。由于线谱对参数比线性预测系数具有更好的内插特性和量化特性, G.729a将LPC参数转换成相应的线谱对参数,最后对线谱对参数进行量化。3开环基音分析为了减少自适应码本搜索的复杂度,需要计算开环基音Top,
18、使自适应码本搜索在开环基音值附近进行。基音值的范围在18145个样本点之间。4自适应码本搜索G.729a对每个子帧进行闭环基音搜索,它通过最小化原始语音信号和重构语音信号的加权均方误差来进行闭环基音搜索。对子帧1的闭环基音T1的搜索是局限在开环基音Top的一个小范围内,对子帧2的闭环基音T2的搜索是局限在闭环基音T1的一个小范围内。这样可以减少基音搜索的复杂度。5固定码本搜索G.729a固定码本矢量含有四个非0脉冲,每个脉冲的幅度要可以是+1或-1。通过最小化加权语音信号和加权重构语音信号的均方误差来进行固定码本的搜索。6增益量化图2.1 G.729a 编码框图G.729a对自适应码本增益和固
19、定码本增益采用二级共轭结构码本进行矢量量化。在码本搜索时,采用预搜索策略,使得运算量只为全搜索算法的1/4。固定码本自适应码本预处理基音分析感觉加权合成滤波器参数编码线性预测分析、量化、插值语音输入增益量化固定码本搜索LPC信息LPC信息LPC信息发送码流加法器加法器解码过程:G.729a的解码也是按帧进行的,主要是对符合G.729a协议的码流进行解码,得到相应的参数,根据语音产生的机理,合成语音。如图2.2所示。其主要部分为:参数解码;后滤波处理。参数解码:首先解码得到线谱对参数,并将线谱对参数转换为线性预测系数。然后解码出基音周期,获得自适应码本矢量V(n)。解码出固定码本矢量的四个脉冲的
20、位置和符号,计算出固定码本矢量C(n)。解码出固定码本预测增益g(c)和固定码本增益G(c)。接着得到激励信号u(n)=gV(n)+Gc(n),n=039。最后将激励信号u(n)输入到线性预测合成滤波器中,计算出重构语音S(n)。后滤波处理:后滤波处理主要是自适应后滤波。自适应后置滤波器是由三个滤波器级连而成:长时后置滤波器Hp(z),短时后置滤波器Hf(z),频谱倾斜补偿滤波器Ht(z),后面接着进行一个自适应增益控制过程。后置滤波器的系数每一个子帧更新一次。后置滤波能够有效地改善合成出的语音质量3。固定码本自适应码本短时滤波器后处理G(c)g(c)加法器图2.2 G.729解码框图G.72
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 毕业设计 制式 语音 编码 及其 DSP 实现
链接地址:https://www.31ppt.com/p-4150883.html