语音信号采集与处理.doc
学 号 11780113天津城建大学 信息处理系统综合设计 设计说明书语音信号采集与处理起止日期: 2014 年 12 月 29 日 至 2015 年 1 月 23 日学生姓名MM班级电信科一班成绩指导教师(签字)计算机与信息工程学院2015年 1月 23日天津城建大学课程设计任务书2014 2015学年第一学期计算机与信息工程学院 电子信息科学与技术专业 11信科一班 班级课程设计名称: 信息处理系统综合设计 设计题目: 语音信号采集与处理 完成期限:自 2014 年 12 月 29 日至 2015 年 1 月 23 日共 4 周设计依据、要求及主要内容(可另加附页):内容及任务:1.要有整体网络仿真过程说明,测试结果达到相应技术指标。2.按规范撰写设计报告,主题明确,内容完整,能体现作者的设计意图和设计构思文字图形编排处理合理。拟达到的要求或技术指标:本设计要求学生录制一段自己的语音信号后,在MATLAB软件中采集语音信号、回放语音信号并画出语音信号的频谱图;对所采集的语音信号加入干扰噪声,对加入噪声的信号进行播放,并进行频谱分析;对比加噪前后的频谱图,分析讨论采用什么样的滤波器进行滤除噪声。目录第一章 前言11.1 研究的意义11.2研究的内容1第二章 语音信号去噪方法的研究32.1 采样定理32.2采样频率32.3去噪的方法3第三章 语音信号采集与处理43.1 语音文件在MATLAB平台上的录入与打开43.2原始语音信号在MATLAB中的最简单表现43.3 加噪语音信号频谱分析及仿真53.4 去噪及仿真6第四章 总结8参考文献9第一章 前言1.1 研究的意义 语音是语言的声学表现,是人类交流信息最自然、最有效、最方便的手段。随着社会文化的进步和科学技术的发展,人类开始进入了信息化时代,用现代手段研究语音处理技术,使人们能更加有效地产生、传输、存储、和获取语音信息,这对于促进社会的发展具有十分重要的意义,因此,语音信号处理正越来越受到人们的关注和广泛的研究。 语音信号是信息技术处理中最重要的一门科学,是人类社会几步的标志。那么什么是语音?语音是人类特有的功能,也是人类获取外界信息的重要工具,也是人与人交流必不可少的重要手段。那么什么又是信号?那信号是什么呢?信号是传递信息的函数。离散时间信号序列可以用图形来表示。 语音信号处理是一门用研究数字信号处理研究信号的科学。它是一新兴的信息科学,同时又是综合多个学科领域的一门交叉科学。语音在我们的日常生活中随时可见,也随处可见,语音很大程度上可以影响我们的生活。所以研究语音信号无论是在科学领域上还是日常生活中都有其广泛而重要的意义。1.2 国内外研究现状 20世纪60年代中期形成的一系列数字信号处理的理论和算法,如数字滤波器、快速傅立叶变换(FFT)等是语音信号数字处理的理论和技术基础。随着信息科学技术的飞速发展,语音信号处理取得了重大的进展:进入70年代之后,提出了用于语音信号的信息压缩和特征提取的线性预测技术(LPC),并已成为语音信号处理最强有力的工具,广泛应用于语音信号的分析、合成及各个应用领域,以及用于输入语音与参考样本之间,时间匹配的动态规划方法;80年代初一种新的基于聚类分析的高效数据压缩技术矢量量化(VQ)应用于语音信号处理中;而用隐马尔可夫模型(HMM)描述语音信号过程的产生是80年代语音信号处理技术的重大发展,目前HMM已构成了现代语音识别研究的重要基石。近年来人工神经网络(ANN)的研究取得了迅速发展,语音信号处理的各项课题是促进其发展的重要动力之一,他的各项成果也体现在语音信号处理的各项技术之中。1.2研究的 内容 本论文主要介绍的是的语音信号的简单处理。本论文针对以上问题,运用数字信号学基本原理实现语音信号的处理,在matlab环境下综合运用信号提取,幅频变换以及傅里叶变换、滤波等技术来进行语音信号处理。我所做的工作就是在matlab软件上编写一个处理语音信号的程序,能对语音信号进行采集,并对其进行各种处理,达到简单语音信号处理的目的。 对语音信号的研究,本论文采用了滤波器的基本研究方法来达到研究语音信号去噪的目的,最终结合图像以及对语音信号的回放,通过对比,得出结论。本课题的研究基本步骤如下:1.语音信号的录制。2.在MATLAB平台上读入语音信号。3.绘制频谱图并回放原始语音信号。4.利用MATLAB编程加入一段随机噪音信号,设计滤波器去噪,并分别绘制频谱图、回放语音信号。流程框图可如下表示:(图1-1)语音信号采集 效果显示语音信号录入语音信号变换信号加噪语音信号滤波图1-1 论文设计的流程第二章 语音信号去噪方法的研究2.1 采样定理在进行模拟/数字信号的转换过程中,当采样频率fs.max大于信号中,最高频率fmax的2倍时,即:fs.max>=2fmax,则采样之后的数字信号完整地保留了原始信号中的信息,一般实际应用中保证采样频率为信号最高频率的510倍;采样定理又称奈奎斯特定理。 1924年奈奎斯特(Nyquist)就推导出在理想低通信道的最高大码元传输速率的公式: 理想低通信道的最高大码元传输速率=2W*log2 N (其中W是理想低通信道的带宽,N是电平强度)为什么把采样频率设为8kHz?在数字通信中,根据采样定理, 最小采样频率为语音信号最高频率的2倍。2.2采样频率 采样频率,也称为采样速度或者采样率,定义了每秒从连续信号中提取并组成离散信号的采样个数,它用赫兹(Hz)来表示。采样频率的倒数是采样周期或者叫作采样时间,它是采样之间的时间间隔。通俗的讲采样频率是指计算机每秒钟采集多少个声音样本,是描述声音文件的音质、音调,衡量声卡、声音文件的质量标准。 采样频率只能用于周期性采样的采样器,对于非周期性采样的采样器没有规则限制。 采样频率的常用的表示符号是 fs。 通俗的讲采样频率是指计算机每秒钟采集多少个声音样本,是描述声音文件的音质、音调,衡量声卡、声音文件的质量标准。采样频率越高,即采样的间隔时间越短,则在单位时间内计算机得到的声音样本数据就越多,对声音波形的表示也越精确。采样频率与声音频率之间有一定的关系,根据采样定理,只有采样频率高于声音信号最高频率的两倍时,才能把数字信号表示的声音还原成为原来的声音。这就是说采样频率是衡量声卡采集、记录和还原声音文件的质量标准。 采样位数和采样率对于音频接口来说是最为重要的两个指标,也是选择音频接口的两个重要标准。无论采样频率如何,理论上来说采样的位数决定了音频数据最大的力度范围。每增加一个采样位数相当于力度范围增加了6dB。采样位数越多则捕捉到的信号越精确。对于采样率来说你可以想象它类似于一个照相机,44.1kHz意味着音频流进入计算机时计算机每秒会对其拍照达441000次。显然采样率越高,计算机摄取的图片越多,对于原始音频的还原也越加精确2.3去噪的方法 数字信号处理技术经过几十年的发展,在国内外已经取得了很大的成绩。到目前为止,已经比较成熟的去噪方法比较典型的有:切比雪夫去噪法、双线性变换去噪法、窗函数去噪法、等有名的去噪方法。下面分别对上述去噪方法中比较有代表性的IIR滤波法做一个简单的介绍。 IIR滤波器去噪法(IIRnfinite Impulse Response)数字滤波器,又名“无限脉冲响应数字滤波器”,或“递归滤波器”。递归滤波器,也就是IIR数字滤波器,顾名思义,具有反馈,一般认为具有无限的脉冲响应。 IIR数字滤波器的设计利用 MATALAB工具箱分析工具(FDATool)可以很方便地设计出符合应用要求的未经量化的IIR数字滤波器。 第三章 语音信号采集与处理3.1 语音文件在MATLAB平台上的录入与打开 单击自己的电脑开始程序,选择所有程序,接着选择附件,再选择娱乐,最后选择录音。自己录入“综合设计”语音信号,然后保存在MATLAB文件夹里面,命名为“test.wav”。利用MATLAB中的wavread命令来读入(采集)语音信号,将它赋值给某一向量。y,fs,bits=wavread(' N1 N2);用于读取语音,采样值放在向量y中,fs表示采样频率(Hz),bits表示采样位数。N1 N2表示读取从N1点到N2点的值(若只有一个N的点则表示读取前N点的采样值)。3.2原始语音信号在MATLAB中的最简单表现 用MATLAB中的wavread命令来读入(采集)语音信号,将它赋值给某一向量。再将该向量看作一个普通的信号。选择设计此方案,是对数字信号处理的一次实践。在数字信号处理的课程学习过程中,我们过多的是理论学习,几乎没有进行实践方面的运用。这个课题正好是对数字语音处理的一次有利实践,而且语音处理也可以说是信号处理在实际应用中很大众化的一方面。这个方案用到的软件也是在数字信号处理中非常通用的一个软件MATLAB软件。所以这个课题的设计过程也是一次数字信号处理在MATLAB中应用的学习过程。课题用到了较多的MATLAB语句,而由于课题研究范围所限,真正与数字信号有关的命令函数却并不多。sound(x,fs,bits); 用于对声音的回放。向量y则就代表了一个信号(也即一个复杂的“函数表达式”)也就是说可以像处理一个信号表达式一样处理这个声音信号。下面的一段程序是语音信号在MATLAB中的最简单表现,它实现了语音的读入打开,以及绘出了语音信号的波形频谱图。x,fs,bits=wavread('wangqingtian.wav);sound(x,fs,bits);X=fft(x,4096);magX=abs(X);angX=angle(X);subplot(221);plot(x);title('原始信号波形');subplot(222);plot(X); title('原始语音信号采样后的频谱图)subplot(223);plot(magX);title('原始信号幅值');subplot(224);plot(angX);title('原始信号相位');程序运行可以听到声音,得到的图形为:图4-1 原始信号波形3.3 加噪语音信号频谱分析及仿真(1)random信号加入原始语音信号 前面已经介绍了MATLAB软件相关知识,那么我们怎么在NATLAB平台上实现对一段原始语音信号加入一个正弦波信号呢? 下面一段程序实现了在原始语音信号加入random信号。程序见附录5 分析此段程序可知,此程序是先对原始语音信号做时域波形分析和频谱分析,然后再对加噪的语音信号做时域波形分析和频谱分析。 首先通过MATLAB中调用和回放语音信号命令来实现对原始语音信号的调用和回放,程序如下:SNR=5; %设置信噪比noise=10(-SNR/10)*(randn(size(signal); b=firlvbo(256,5e3,Fs,Fs,'hpf');noise=filter(b,1,noise); %产生信号signal_noise=signal + noise; %加入噪声figureplot(signal_noise); %画出加噪声后的音频信号波形 上段程序中,函数noise是random信号噪音,加噪后的时域波形和频谱图如下:随机噪音信号加入原始语音信号 人耳可以明显辨别出两种语音信号不一样了,加噪后的语音信号在听觉上比原始语音信号要浑浊很多,而且还有吱吱嘎嘎的混杂音。3.4 去噪及仿真(1)滤波器法去噪 下面的一段程序是语音信号在MATLAB中的滤波器法去噪title('加噪后的音频信号')msgbox('正在播放加噪声后的音频!'); %弹出提示框wavplay(signal_noise,Fs);b=firlvbo(256,0,5e3,Fs,'lpf'); %生成低通滤波器系数signal_fir=filter(b,1,signal_noise); %对加噪声的信号进行滤波去除噪声figure; %下面是画出最后处理完去除完噪声 再从对语音信号的回放,人耳可以明显辨别语音信号。滤波后,语音信号较加噪后的信号有了明显的改善,可以听清楚了。第四章 总结 语音信号处理是语音学与数字信号处理技术相结合的交叉学科,课题在这里不讨论语音学,而是将语音当做一种特殊的信号,即一种“复杂向量”来看待。也就是说,课题更多的还是体现了数字信号处理技术。 从课题的中心来看,课题“在MATLAB平台上实现对语音信号的去噪研究和仿真”是希望将数字信号处理技术应用于某一实际领域,这里就是指对语音及加噪处理。作为存储于计算机中的语音信号,这一过程的实现,用到了处理数字信号的强有力工具MATLAB。通过MATLAB里几个命令函数的调用,很轻易的在实际语音与数字信号的理论之间搭了一座桥。 课题的特色在于它将语音信号看作一个向量,于是就把语音数字化了。那么,就可以完全利用数字信号处理的知识来解决语音及加噪处理问题。我们可以像给一般信号做频谱分析一样,来对语音信号做频谱分析,也可以较容易的用数字滤波器来对语音进行滤波处理。通过比较加噪前后,语音的频谱和语音回放。从含噪语音信号的频谱图中可以看出含噪声的语音信号频谱,在整个频域范围内分是布均匀。其实,这正是干扰所造成的,低通滤波后效果不错。参考文献1 Boll S F.Suppression of Acoustic Noise in Speech Using Spectral SubtractionJ.IEEE Trans.on Acoustics,Speech,and Signal Processing,1979,27(2):113-120.2 Berouti M,Schwartz R,Makhoul J.Enhancement of SpeechCorrupted by Acoustic NoiseJ.IEEE Trans.on Acoustics,Speech,and Signal Processing,1979,4:208-211. 3 胡航,语音信号处理,哈尔滨工业大学出版社,2000 年 5 月 4ThomsonDJ.SpectrumEstimationand armonicAnalysisJ.Proc.IEEE,1982,70(9):1 055-1 096. 5皇甫堪,陈建文,楼生强.现代数字信号处理M.北京:电子工业出版社,2003. 6Hu Yi,Loizou P C.Speech Enhancement Based on WaveletThresholding the Multitaper SpectrumJ. IEEE Trans.onSpeech and Audio Processing,2004,12(1):59-67. 7吴红卫,吴镇扬,赵力.基于多窗谱的心理声学语音增强J.声学学 报,2007,32(3):275-281.8潘欣裕,童兴法,赵鹤鸣,基于谱能比例加权的谱减法语音增强研究J. 中 国电子学会第十五届信息论学术年会暨第一届全国网络编码学术年会论文集 9 程正,赵鹤鸣. 基于多频带谱减法的语音增强算法的研究J. 002-8331(2007)36-0040-03.10 曹瑜镠,方元,吕勇.基于最小统计及谱减法的语音增强J. 语音技术. 002-8684(2006)12-0043-04 11白文雅,黄健群,陈智伶.基于维纳滤波语音增强算法的改进实现J.电声 技术,2007,31(1) :44-46.12蔡斌.一种改进型 MMSE 语音增强方法J.信号处理,2004,20(1) :70-74.13陈俊,孙洪,董航.基于 MMSE 先验信噪比估计的语音增强J.武汉大学学 理学版,2005,51(5) :638-642.14樊昌信,曹丽娜.通信原理M.北京:国防工业出版社,2008.15姚天任.数字语音处理M.武汉:华中科技大学出版社,2005.