基于dsp语音信号编解码器设计毕业设计论文.doc
《基于dsp语音信号编解码器设计毕业设计论文.doc》由会员分享,可在线阅读,更多相关《基于dsp语音信号编解码器设计毕业设计论文.doc(38页珍藏版)》请在三一办公上搜索。
1、摘 要DSP芯片,也称数字信号处理器,是一种针对数字信号处理而特别设计的微处理器。随着超大规模集成电路技术上取得的突破进展,集成化的DPS数字信号处理器具有体积小、功耗低和运算速度快等诸多优点,因此非常适用于语音信号的压缩处理。目前的DPS芯片以其强大的数据处理功能而在通信和其他信号处理领域得到广泛注意,并已成为开发应用的热点技术。近年来,随着多媒体信息技术和网络技术的高速发展,数字语音压缩技术的应用领域越来越广泛,目的是在保证语音一定质量的前提下尽可能降低其编码比特率,便于在有限的传输带宽内让出更多的信道来传送图像、文档、计算机文件和其他数据流。为此,国际电信联盟(ITU)推出了G.711标
2、准,即PCM编码调制。具有语音质量高、低延时和稳定性好的优点,可用于数字语音通信领域,具有很高的研究价值。本文首先简要的介绍了语音压缩编码算法的发展进程,以及发展趋势。在着重分析和研究了G.711标准的算法原理的基础上,详细说明了基于高性能DSP(TMS320F2812)的语音压缩编解码系统的实现方法,并针对算法的实时实现出现的运算量大的问题。全文分为四章,第一章概述语音压缩编解码的发展进程、趋势以及课题的主要研究内容及意义。第二章分析了语音信号编、解码原理与G.711标准的算法原理和论述了TMS320F2812软、硬件的开发和设计。第三章主要对结果进行讨论与验证。第四章详细的对全文进行了总结
3、。关键词:语音压缩编码,G.711, TMS320F2812。Abstract DSP Processor is designed for real-time digital signal Process.With the great Progresses and a series of break-through in VLSI technologies,integrated DSPs process out soon after. Integrated DSPs Possess many advantages,such as compactness,low Power cost,and h
4、igh working speed and so on which are mostly suitable in speech signal compressing. Present DSPs are getting more and more attentions in the information field,due to its Powerful signal Processing ability,becoming a hot-point technique in communication and other relating signal nrocessing areas. Wit
5、h the rapid development of Multimedia communication technology and Internet technology, Application of Digital speech Coding is more widely in recent years. Digital speech Coding can reduce rate of bits ,for the purpose of provided more channels to transfer image、document、computer files and other Da
6、ta stream, but the operation must assure quality of speech. So ITU introduce G.711, a voice compressing criterion, 64kbps rate speech Coding.The criterion have the advantages of high speech quality、low time delay and good stability,which can be applied in the area of digital speech communication and
7、 be worth researching highly. First of all the development course and tendency of Speech Compress Coding has been introduced. On the basis of analysis and research to theory of G.711 criterion arithmetic,realization of the algorithm of speech codings system based on TMS320F2812 is narrated .Due to l
8、arge operation when arithmetic is run in real-time,several methods of optimized codes was put forward .Loaded optimized codes in TMS320F2812 and simulated,the arithmetics performance was compared Whole paper is made up of three chapters In the first chapter,summarizes the classification、standard and
9、 tendency of Speech coding ; in the second chapter,theories of G.711 criterion arithmetic are analyzed: design of hardware and software speech coding,system based on TMS320f2812;in the third chapter the results of the experiment are analyzed; in the last chapter ,the main conclusions of design are s
10、ummarized. Keywords: Speech Compress Coding,G.711criterion, TMS320F2812.第一章 引 言1.1语音编码的发展进程及现状语音信号处理的研究工作最早可以追溯到1876年贝尔发明的电话,该发明首次用声电、电声转换技术实现了远距离的语音传输。1939年Dudley研制成功第一个声码器,从此奠定了语音产生模型的基础,这一工作在语音信号处理领域具有划时代的意义。本世纪30年代以前,语音信号的处理及传输均是以模拟的方式进行。1937年A.H.Reeves提出了脉冲编码调制PCM(Pulse Code Modulation)理论开创了语音数
11、字化通信的历程。数字化语音的传输与存储可靠性、抗干扰、速交换、易保密等各方面都远胜于模拟语音。从最初的64kbps的标准PCM波形编码器到现在4kbps以下的参量编码的声码器,语音压缩编码在几十年里得到迅速发展。语音压缩编码的发展经历了以下几个阶段:波形编码、参量编码及二者相结合的混合编码。此外还有此基础上发展而来的增强多带激励声码器MBE(IMBE)算法。波形编码是将时间域信号直接变换为数字代码,力图使重建语音波形保持原语音信号的波形形状。波形编码的基本原理是在时间轴上对模拟语音按一定的速率抽样,然后将幅度样本分层量化,并用代码表示。解码是相反过程,将接收的数字序列经解码和滤波后恢复成模拟信
12、号。波形编码具有抗噪性能强、语音质量好等优点,但需要较高的数码率,一般为16kbps 64kbps。如果希望有较高的编码质量,当编码速率在下降时,其合成语音的性能会下降得很快。最近,对于波形编码器提出了一些新技术,例如后滤波器、改进激励程序等,使得语音质量有比较大的提高。参数编码又称为声码器技术,它通过对语音信号进行分析,提取参数来对参数进行编码,在接收端能够用解码后的参数重构语音信号。参数编码主要是从听觉感知的角度注重语音的重现,即让解码语音听起来与输入语音是相同而不是保证其波形相同。这种编码方式一般对数码率的要求要比波形编码低很多,但只能达到合成语音的质量(即自然度、讲话者的可识别性都较差
13、的语音),即使码率提高到与波形编码相当时,语音质量也不如波形编码。应用广泛的线性预测LPC(Linear Predictive Coding)声码器是典型的语音参数编码器。最新的参数编码器有正弦变换编码器、波形内插编码器等。在保证语音质量的前提下,进一步降低比特率,仍然是语音编码研究的主要焦点。然而,这是一个很复杂的问题,它受多种因素的限制,例如:语音信号所包含的信息内容。但是,作为一个速率低限,临界信息速率应该是人理解信号所需要的最小速率,但这是一个还需要继续深入研究的问题。因为有关语音信号的某些信息,人能够感觉到有变化,而编码器却找不到对应的特征参量。反之,有时语音的波形和特征参量变化很大
14、,而人同样可以理解。要达到理论上50bit/s确语音信息率最低限这个目标,对人脑感知信号的过程,必须有更深入的研究。在中国,语音和语言处理技术的研发略晚于国外。中国科学院声学研究所的俞铁城教授应该说是中国最早涉足这一领域的人之一,他于1977年在物理学报发表了全国第一篇关于语音识别的论文。清华大学语音技术中心紧随其后,语音界老前辈方棣棠教授、吴文虎教授于1979年创立语音技术中心(原名语音实验室),现已有27年的历史。随后,全国各地从事这方面研究的机构越来越多,比较著名的有清华大学电子工程系、中国科学院自动化研究所、中国科技大学、中国社会科学院语言研究所(在语音学研究方面,吴宗济先生的起步更早
15、)、北京大学、哈尔滨工业大学等等。在这些顶尖的学术机构的带动下,中国的语音和语言处理技术得到很大发展,并逐步在国际上引起注意。1.2语音编码技术语音编码的主要功能就是把语音的采样值编码成少量的比特(帧)。而且,在通信过程产生误码、网络抖动和突发传输时,这种方法必须具有健壮性(Robustness)。在接收端,语音帧先被解码为采样值,然后再转换成语音波形。语音编码的目的,是在给定的编码速率下,使得从解码恢复出的重构语音的质量尽可能高。语音编码主要可分为两种:波形编码和参数编码。波形编码就是根据语音的信号波形导出相应的数字编码形式,令在接收端的解码器能恢复出与输信号波形相一致的原始语音。波形编码的
16、基本思路是忠实地再现语音的时域波形。为了降低比特率,波形编码会充分利用相邻抽样点之间的相关性,对差分信号进行编码。波形编码的方法简单,有较好的合成语音质量。但它的码率高,当码低于32kbps的时候音质明显降低。著名的波形编码标准有G.711(64kbps PCM编码调制)和G.726(16/24/32 kbps ADPCM自适应差分脉冲编码调制)。参数编码的原理和设计思想和波形编码完全不同。它根据对人的发声机理的第一章绪论分析,着眼于构造语音生成模型,该模型以一定的精度模拟发声者的声道,接收端根据该模型还原生成发声者的语音。编码器发送的主要信息是语音生成模型的参数,相当于语音的主要特征,而并非
17、语音的波形幅值。参数编码器可以有效地降低编码比特率,目前小于16kbps的低比特率语音编码都采用参数编码。1.3本论文的主要内容 随着信息技术的发展,人们对带宽有限的无限通信、信道价格昂贵的卫星通信和军用保密通信的需求不断增加,各种与语音应用服务相关的新业务不断涌现,要求语音数据能被灵活处理、存储、转发和传送。为了减少存储量和传输速率,需要对语音信号进行编码压缩,因而对语音编码技术的研究和开发受到越来越多研究人员的重视。如何在有限的频带中得到较高的合成语音质量,并且尽可能地降低语音传输速率,就成为了亟待解决的问题。研究人员对国际电信联盟ITU公布的一系列语音编码标准的算法实现上做了大量工作,尤
18、其对一些性能优良的算法。当前,对G.711标准中算法的研究一直在进行,并且取得了很大的成绩,程序得到了很大的优化。但是这些研究更多的是集中在如何减小整个算法的复杂度方面,完全独立在DSP平台上的实现则相对很少。本文主要讨论G.711标准的编码以及其在基于TMS320F2812实时实现的设计与开发。首先简要的介绍了语音压缩编码算法的发展进程,以及发展趋势,然后着重分析和研究了G.711标准的算法原理与结构,详细说明了基于高性能TMS320F2812的语音压缩编解码的实现方法,并针对算法的实时实现出现的运算量大的问题。全文分为四章,第一章概述语音压缩编解码的发展进程、趋势以及课题的主要研究内容及意
19、义。第二章分析了语音信号编、解码原理与G.711和论述了TMS320F2812软、硬件的开发和相关技术。第三章主要介绍对系统进行硬件设计。第四章详细介绍系统的软件设计以及对实验结果进行了总结。第二章 相关技术介绍2.1 G.711编解码原理介绍2.1.1 语音的数字化过程 语音的数字化过程是语音传输的基础,是把模拟的语音信号转化为可控制的数字信号的过程其主要操作是将模拟音频信号每隔一定时间间隔截取一段,并将所截取的信号振幅转换成由一组二进制序列表示的离散序列,即数字音频序列。在这一处理过程中,涉及到对模拟音频信号的采样、量化和编码。 (1)取样过程:模拟音频信号是一个在时间上和幅值上都连续的函
20、数f(f)。取样的过程就是在时间上将函数f(1)离散化的过程。一般的取样是按均匀的时间间隔进行的。由于人耳能听到的声音的频率范围大致在20Hz-20kHz,因此声音的质量与音频信号的频谱范围以及采样时间间隔有关。表2-1 常用的音频取样频率取样频率(khz)811.051622.0544.148量化精度(bit)8816161616数据率(kb/s)6488.4256352.8705.6768从2-1表中可以看出,取样频率越高,数字化后的音频质量越高,存储量也越大,所以使用哪种取样频率要兼顾语音质量和信道容量。(2)量化过程:是将取样值在幅度上再进行离散化处理的过程。所有的取样值可能出现的范围
21、被划分成有限多个小阶距(量化步长)的集合,把凡是落入某个量化阶距内的取样值都赋予相同的值,即量化值。通常这个量化值是用二进制来表示的。如果量化阶距是相同的,或者说是量化值的分布是均匀的,称之为均匀量化,否则称为非均匀量化。 (3)编码过程:模拟音频信号经过取样、量化后,就要进行编码,即用二进制数表示每个取样的量化值。如果取样值既采取均匀量化,又采取自然二进制表示,这种编码方法就是脉冲编码调制PCM(Pulse Code Modulation)。PCM是一种最简单、最方便的编码方法。经过编码后的数字信号就是数字音频信号。由于PCM是一种未经过压缩的数字音频信号,因此常常将它作为与其他编码进行比较
22、的一种参考信号。表示取样值的二进制的位数为量化位数,它反映各取样值的精度,如4位能表示取样值的16个等级,8位能反映256个等级,其精度为音频信号最大振幅的11256。量化位数越多,量化值越接近于取样值,其精度越高,但要求的信息存储量越大。取样值存储量可用下式表示:v=fBs8式中,v为取样值存储量(bit/s),伪取样频率(kHz),B为量化位数(bit),s为声道数。2.1.2 G.711语音压缩国际标准 G.711是一种工作在8KHz采样率模式下的脉冲编码调制方案,采样值是八位的,按照奈奎斯特法则规定,采样频率必须由高于被采样信号的最大频率成分的2倍,G.711可以编码的频率范围是从0到
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 dsp 语音 信号 编解码器 设计 毕业设计 论文
链接地址:https://www.31ppt.com/p-4141475.html