数字语音处理课程设计.docx
《数字语音处理课程设计.docx》由会员分享,可在线阅读,更多相关《数字语音处理课程设计.docx(31页珍藏版)》请在三一办公上搜索。
1、数字语音处理课程设计(论文)任务书软件学院软件+信息工程专业07班一、课程设计(论文)题目语音信号处理二、课程设计(论文)工作自2010年12月6日起至20自年12月10日止。三、课程设计(论文)地点:图书馆、通信实验室四、课程设计(论文)内容要求:1.本课程设计的目的1)使学生掌握语音信号处理的根本概念、根本理论和根本方法;2)培养学生掌握语音信号采集过程;3)使学生掌握语音信号传输的特点;4)培养学生分析、解决问题的能力;5)提高学生的科技论文写作能力;6)学会使用MATLAB,Praat等工具软件。21课程的M务及要求1)根本要求:一用COOLEDrr录制一段语音信号;对语音信号进行采样
2、,画出采样后语音信号的时域波形、频谱图和语谱图;利用MATLAB中的随机函数产生噪声参加到语音信号中,再进行一频谱分析;设计滤波器,并对被噪声污染的语音信号进行滤波,画出滤波前后信号的时域波形和频谱,并进行比拟分析;对处理后的语音信号进行回放。2)创新要求:一在根本要求到达后,可进行创新设计,如采用多种滤波器对信号进行处理;经过对录制的语音进行分析,能合成对应的语句。3)课程设计论文编写要求要按照书稿的规格打印善写课程设计论文;论文包括目录、中文摘要、绪论、正文、小结、参考文献、附录等;按课程设计论文装订采用学校统一封面;4)评分要点:完成原理分析;完成仿真丽一完成语音回放;答复下列问题;格式
3、标准;5)参考文献:胡航.语音信号处理哈工大出版社(2)LawrenCeRabiner.语音信号数字处理科学出版社杨翠娥.高频电子线路实验与课程设计哈尔滨工程大学出版社,学生签名:2010年12月6日6)课程设计进度安排内容天数地点构思及收集资料0.5图书馆仿真分析员3.5实验室撰写论文1图书馆、实验室课程设计(论文)评审意见(1)原理分析(10分):优()、良()、中()、般()、差();(2)时域分析(25分):优()、良()、中()、一般()、差();(3)频域分析(25分):优()、良()、中()、一般()、差();(4)噪声分析(25分):优()、良()、中()、一般()、差();(
4、5)语音回放(15分):优()、良()、中()、及格()、差();(6)格式标准性及考勤是否降等级:是()、否()评阅人:罗晖职称:副教授2010年12月15日摘要语音信号处理是研究用数字信号处理技术对语音信号进行处理的一门学科,是一门新兴的交叉学科,是在多门学科根底上开展起来的综合性技术。它涉及到数字信号处理、模式识别、语言学、语音学、生理学、心理学及认知科学和人工智能等许多学科领域。语音信号处理是目前开展最为迅速的信息科学研究领域中的一个,其研究设计一系列前沿课题,切处于开展之中。其研究成果具有重要的学术及应用价值!语音信号的采集和分析技术的应用和开展与语音学、声音测量学、电子测量技术等学
5、科紧密联系,其中语音采集和分析仪器的小型化、智能化、数字化以及多功能化的开展越来越快,分析速度较以往也有了大幅度的提高。本次课程设计主要介绍了语音信号的录制、语音信号的采集与分析、语音信号的采样、语音信号的频谱分析、加噪后的频谱分析、滤波器的设计以及对于语音信号的回放等知识。通过PC机或COOLEDITPRO录制一段语音信号,运用MATLAB或Praat对其进行仿真分析,然后设计滤波器参加噪声进行滤波处理,比拟滤波前后始于波形或频谱的变化,最后实现对于语音的回放设计!关键词:语音信号,采集与分析,语音回放,滤波器,MATLAB1371114192022231.绪论2 .语音信号处理的原理3 .
6、语音信号的录制与采集4 .语音信号的时域及频域分析5 .语音信号的加噪与频谱分析6 .滤波器的设计及分析7 .语音信号的回放8 小结9 10 .附录1.绪论1.1 课题背景及意义语音信号处理是一门比拟实用的电子工程专业课程,语音是人类获取信息的重要来源和利用信息的重要手段。通过语言相互传递信息是人类最重要的根本功能之一。语言是人类特有的功能,它是创造和记载几千年人类文明史的根本手段,没有语言就没有今天的人类文明。语音是语言的声学表现,是声音和意义的结合体,是相互传递信息的最重要的手段,是人类最重要、最有效、最常用和最方便的交换信息的形式。语言和语音夜市人类进行思维的一种依托,他与人的智力活动密
7、切相关,也文化和社会的进步紧密相连,具有最大的信息容量和最高的智能水平。语音信号处理是研究用数字信号处理技术对语音信号进行处理的一门学科,它是一门新兴的学科,同时有时综合性的多科学领域和涉及面很广的交叉学科。它是许多信息领域应用的核心技术之一,是目前开展最为迅速的信息科学研究领域的一个!同时也是目前极为活泼的热门的研究领域,其研究涉及一些列前沿科研课题,切处于迅速开展之中;其研究成果具有重要的学术及应用价值。1.2 国内外研究现状20世纪60年代中期形成的一系列数字信号处理的理论和算法,如数字滤波器、快速傅立叶变换(FFT)等是语音信号处理的理论和技术根底。随着信息科学技术的飞速开展,语音信号
8、处理在最近20多年中取得了重大进展:进入70年代之后,提出了语音信号的信息压缩和特征提取的线性预测技术(LPC),已成为语音信号处理最前有利的工具,广泛应用于语音信号处理的分析、合成及各个应用领域;以及用于输入语音与参考样本之间时间匹配的动态规划方法。80年代初一种新的基于聚类分析的高效数据压缩技术一一矢量量化应用于语音信号处理中;而隐式马尔科夫模型(HMM)描述语音信号过程的产生是80年代语音信号处理技术的重大进展,目前HMM已构成了现代语音识别研究的重要基石。近年来人工神经网络的研究取得了迅速开展,语音信号处理的各项课题是促使其开展的重要动力之一;同时,他的许多成果也表达在有关语音信号处理
9、的各项应用之中,尤其语音识别是神经网络的一个重要应用领域。1.3 课题研究目的通过本次课程设计,稳固所学的语音信号处理的理论知识,使自己掌握语音信号处理的根本概念、根本理论和根本方法,培养自身掌握语音信号采集过程以及语音信号传输的特点,同时培养自身分析和解决问题的能力!1.4软件介绍1.4.1MATLABMATLAB的名称源自于MatriXLaboratory,它是一种科学计算软件,专门以矩阵的形式处理数据。MATALB将高性能的数值计算和强大的数据可视化功能集成在一起,并提供了大量的内置函数,从而被广泛地应用于科学计算、控制系统、信息处理等领域的分析、仿真和设计工作,而且利用MATLAB产品
10、的开放式结构,可以非常容易地对MATLAB的功能进行扩充,从而在不断深化对为题认识的同时,不断完善MATALB产品以提供哦啊产品自身的竞争能力!MATLAB主要面对科学计算、可视化以及交互式程序设计的高科技计算环境。它将数值分析、矩阵计算、科学数据可视化以及非线性动态系统的建模和仿真等诸多强大功能集成在一个易于使用的视窗环境中,为科学研究、工程设计以及必须进行有效数值计算的众多科学领域提供了一种全面的解决方案,并在很大程度上摆脱了传统非交互式程序设计语言(如C、Fortran)的编辑模式,代表了当今国际科学计算软件的先进水平。1.4.2PRAATPraat语音学软件,原名Praat:doing
11、phoneticsbycomputer,通常简称Praat,是一款跨平台的多功能语音学专业软体,主要用於对数字化的语音信号进行分析、标注、处理及合成等实验,同时生成各种语图和文字报表。Praat的主要功能是对自然语言的语音信号进行采集、分析和标注,并执行包括变换和滤波等在内的多种处理任务。作为分析结果的文字报表和语图,不但可以输出到个人计算机的磁碟文件中和终端的显示器上,更能够输出为精致的向量图或点阵图,供写作和印刷学术论文与专着使用。此外,Praat还可用於合成语音或声音、统计分析语言学数据、辅助语音教学测试,等等。随着新版本的发布,Praat的功能和用途仍在不断扩展,但实际上多数用户只需要
12、用到一小局部功能。2语音信号处理的原理2.1采样、采样频率及采样位数由于声音为模拟连续信号,而计算机只能处理数字离散信号,因此要使用计算机来分析和处理声音,就需要经历模数转换过程AnalogtoDigitalConverter,即ADC,即将模拟的连续信号转换为数字离散信号。采样就是按照一定的时间间隔从模拟连续信号提取出一定数量的样本来,其样本值用二进制码0和1来表示,这些0和1便构成了数字音频文件,其过程实际上是将模拟音频信号转换成数字离散信号。采样频率是指计算机每秒钟采集多少个声音样本,采样频率越高,即采样的间隔时间越短,那么在单位内计算机得到的声音样本数据就越多,对声音波形的表示也越精确
13、,即数字信号的保真度越高,但同时占用的存储空间也越大。只有采样频率高于声音信号最高频率的两倍时,才能把数字信号表示的声音复原成原来的声音。采样位数即采样值或取样值,用来衡量声音波动变化的参数,是指声卡在采集和播放文件时所使用数字声音信号的二进制位数。采样位数和采集率对于音频接口来说是最为重要的两个指标,也是选择音频接口的两个重要指标。无论采样频率如何,理论上来说采样的位数决定了音频数据最大的力度范围。采样率越高,计算机社区的图片越多,对于原始音频的复原也越加精确!2.2时域分析与频域分析语音信号是一种非平稳、事变、离散性大、信息量大的复杂信号,处理难度很大。它携带着各种信息。在语音通信、语音合
14、成、语音识别和语音增强等语音处理中无一例外需要提供语音中包含的各种信息。只有将语音信号分析成表示其本质特性的参数,才有可能利用这些参数进行高效的语音通信,才能奖励用于语音合成的语音库以及用于语音识别的模版或知识库。语音信号分析可以分为时域和变换域等处理方法,其中时域分析是最简单的方法,直接对语音信号的时域波形进行分析,提取的特征参数主要有语音的短时能量,短时平均过零率,短时自相关函数等。信号的傅立叶表示在信号的分析预处理中起着重要的作用。因为对于线性系统来说,可以很方便确实定其对正弦或复指数和的响应,所以傅立叶分析方法能完善地解决许多信号分析和处理问题。另外,傅立叶表示使信号的某些特性变得更明
15、显,因此,它能更深入地说明信号的各项变化。由于语音信号是随着时间变化的,通常认为ieyuyin是一个受准周期脉冲或随机噪声源机理的线性系统的输出。输出频谱是升到系统频率响应与鼓励预案频谱的成绩。声道系统的频率响应及鼓励源都是随时间变化的,因此一般标准的傅立叶表示虽然适用于周期及平稳随即信号的表示,但不能直接用于语音信号。由于语音信号可以认为在短时间内,近似不变,因而可以采样短时分析法。2. 3滤波器数字滤波器由数字乘法器、加法器和延时单元组成的一种算法或装置。数字滤波器的功能是对输入离散信号的数字代码进行运算处理,以到达改变信号频谱的目的。数字滤波器是一个离散时间系统(按预定的算法,将输入离散
16、时间信号转换为所要求的输出离散时间信号的特定功能装置)。数字滤波器有低通、高通、带通、带阻和全通等类型。它可以是时不变的或时变的、因果的或非因果的、线性的或非线性的。应用最广的是线性、时不变数字滤波器,以及f.i.r滤波器。3.语音信号的录制与采集对于语音信号的录制与采集主要可以使用两种方法:使用WineIoWS自带录音机录制、使用专业录音工具COoIeditproo3. 1使用WindoW自带录音工具使用windows自带录音机录制语音文件,进行数字信号的采集。将话筒输入计算机的语音输入查扣上,启动录音机。录制一段录音,录音停止后,文件存储器的后缀默认为.Wav。将录制好文件保存,记录保存路
17、径。图3.1是基于PC机的语音信号采集过程:Wav图3.13.2 CoolEditPrO录音操作翻开COolEditPrO软件,通过“文件”菜单下的“新建工程”选项,在弹出的对话框中选择采样频率以及声道;连接好麦克风即可开始录音,具体设置可根据个人要求做不同设置!图3.2为CoolEditPro录制过程截图:H Cool Fdit Pro -小TS廿图3.23.3 语音信号的读取在MATLAB软件平台下,利用wavread函数对语音信号进行采样,记住采样频率和采样点数。通过使用WaVread函数,理解采样、采样频率、采样位数等概念!Wavread函数调用格式:y=wavread(file),读
18、取file所规定的WaV文件,返回采样值放在向量y中。y,fs,nbits=wavread(file),采样值放在向量y中,fs表示采样频率(hz),nbits表示采样位数。y=wavread(file,N),读取前N点的采样值放在向量y中。y=wavread(file,NI,N2),读取从Nl到N2点的采样值放在向量y中。3.4 对语音信号进行采样语音信号为rs.wav,内容为数字语音信号,将名为rs.wav的语音信号保存到工作空间WOrk文件夹下。在M文件中输入以下程序:y,fs,nbits=wavread(rs.wav,)图3.4为运行结果:0.0024O.00630.0078-0.00
19、010.0091fe=22050nbitB二图3.4根据结果可知:该语音信号的采样频率为22050HZ,采样位数为161.1 语音信号的时域分析语音信号的时域分析就是分析和提取语音信号的时域参数。进行语音分析时,最先接触到并且夜市最直观的是它的时域波形。语音信号本身就是时域信号,因而时域分析是最早使用,也是应用最广泛的一种分析方法,这种方法直接利用语音信号的时域波形。时域分析通常用于最根本的参数分析及应用,比方语音的分割、预处理、大分类等。这种分析方法的特点是:表示语音信号比拟直观、物理意义明确。实现起来比拟简单、运算且少。可以得到语音的一些重要的参数。只使用示波器等通用设备,使用较为简单等。
20、语音信号的时域参数有短时能量、短时过零率、短时自相关函数和短时平均幅度差函数等,这是语音信号的一组最根本的短时参数,在各种语音信号数字处理技术中都要应用在计算这些参数时使用的一般是方窗或海明窗。时域信号的FFT分析:FFT即为快速傅氏变换,是离散傅氏变换的快速算法,他是根据离散傅氏变换的奇、偶、虚、实等特性,对离散傅里叶变换的算法进行改良获得的。在MATLAB的信号处理工具箱中FFT和IFFT用于快速傅里叶变换和及变换。函数FFr用于序列快速傅立叶变换,其调用格式为y=fft(x),其中,X是序列,y是序列的FFT,X可以为一向量或矩阵,假设X为一向量,y是X的FFT且和X相同长度;假设X为一
21、矩阵,那么y是对矩阵的每一列向量进行FFT。如果X长度是2的幕次方,函数fft执行高速基一2FFT算法,否那么fft执行一种混合基的离散傅里叶变换算法,计算速度较慢。函数FFT的另一种调用格式为y=fft(x,N),式子中,X,y意义同前,N为正整数。函数执行N点的FFT,假设X为向量且长度小于N,那么函数将X补零至长度N;假设向量X的长度大于N,那么函数截短X使之长度为N;假设X为矩阵,按相同方法对X进行处理。1.2 语音信号的频域分析语音信号的频域分析就是分析语音信号的频域特征。从广义上将,语音信号的频域分析包括语音信号的频谱、功率谱、倒频谱、频谱包络等,而常用的频域分析方法有带通滤波器组
22、法、傅立叶变换发、线性预测法等几种。因为语音信号是非平稳过程,因此适用于周期、瞬变、或平稳随机信号。标准傅里叶变换不能直接表示语音信号,而应该用短时傅立叶变换对语音信号的频谱进行分析,相应的频谱成为“短时谱”把语音信号加载入MATLAB仿真软件平台的工作空间中,然后画出信号的时域波形,然后再对语音信号进行频谱分析。MATLAB提供了快速傅立叶变换算法FFT计算DET的函数ffto在时域内,语音信号具有“短时性”的特点,即在总体上,语音信号的特征是随着时间而变化的,但在一段较短的时间间隔内,语音信号保持平稳。在浊音段表现出周期信号的特征,在清音段表现出随机噪声的特征。在频域内,语音信号的频谱分量
23、主要集中在300340OHZ的范围内。利用这个特点,可以用一个防混迭的带通滤波器将此范围内的语音信号频率分量取出,然后按8kHz的采样率对语音信号进行采样,就可以得到离散的语音信号。M文件的代码如下:y,fs,nbits=wavread(rs);sound(y,fs,nbits);%回放语音信号N=length(y);%求出语音信号的长度Y=fft(y,N);%傅里叶变换subplot(2,l,l);plot(y);title(,原始信号时域波形);subplot(2,l,2);plot(abs(Y);EleC原始信号频谱)以下为运行结果,图4.1为时域波形,图4.2为频谱图原始信号时域波形图
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数字 语音 处理 课程设计
链接地址:https://www.31ppt.com/p-6788280.html