信息处理课群综合训练与设计语音信号盲分离.doc
《信息处理课群综合训练与设计语音信号盲分离.doc》由会员分享,可在线阅读,更多相关《信息处理课群综合训练与设计语音信号盲分离.doc(38页珍藏版)》请在三一办公上搜索。
1、目 录目 录I摘 要IIABSTRACT1 前 言11.1 盲语音信号分离技术的背景及意义11.2语音噪声特性分析11.2.1 语音的特性11.2.2语音信号的基本特征22 盲信号处理32. 1 盲信号处理的基本概念32.2 盲信号处理的方法和分类32.3 盲信号处理技术的研究应用43 盲源分离法63.1 盲源分离技术63.2 盲分离算法实现63.3 盲源分离技术的研究发展和应用73.4 独立成分分析83.4.1 独立成分分析的定义103.4.2 ICA的基本原理113.4.3 本文对ICA的研究目的及实现124 盲语音信号分离的实现及抑噪分析134.1 盲语音信号分离的实现134.1.1 盲
2、信号分离的三种算法144.1.2 不同算法的分离性能比较144.2 Fastica的算法仿真及结果分析184.2.1 Fastica算法仿真实现184.2.2分离结果分析234.2.2 FastICA算法的分离性能分析275 结 论296 感想与总结307 参考文献31附 录32摘 要语音信号盲分离处理的含义是指利用盲源分离(Blind Source Separation,BSS)技术对麦克风检测到的一段语音信号进行处理。混合语音信号的分离是盲分离的重要内容,目前的混叠语音分离大多是建立在无噪环境中的混叠情形下,主要以盲源分离(Blind Source Separation,BSS),根据信号
3、的统计特性从几个观测信号中恢复出未知的独立源成分。本文重点研究了以语音信号为背景的盲处理方法,在语音和听觉信号处理领域中,如何从混有噪声的的混叠语音信号中分离出各个语音源信号,来模仿人类的语音分离能力,成为一个重要的研究问题。具体实现主要结合ICA技术,将语音去噪作为一个预处理过程,对带噪声的混叠语音盲分离进行了研究,本文详细了介绍FastICA算法将该算法应用于实际的语音信号分离中,文章最后还介绍了分离效果评价准则,并比较了相关系数。关键词: 语音信号,盲源分离,独立成分分析ABSTRACTBlind separation of speech signal processings meani
4、ng is using BSS techniques to separate the mixed voice signals recorded in microphone. Separation of mixed speech signals is important for blind separation. The current separation of overlapping speech is built mostly in the absence of aliasing noise in the environment, under the circumstances, main
5、ly in blind source separation (Blind Source Separation, BSS), the statistical characteristics of signal several observations from the unknown signal to recover the independent source components; This article focuses on how to separate the mixed speech signal using FastICA algorithm. We first get two
6、 clean speech signals then using a mixed matrix to mix the speech signals to get the mixed signals. And then we use FastICA algorithm to separate the mixed speech signal. Finally, we use the correlation coefficient and the relative error to evaluate the separation effects. The simulation results dem
7、onstrate that the separation effects are satisfied. Key Words: Voice signal, voice signal noise, blind source separation, independent component analy1 前 言1.1 盲语音信号分离技术的背景及意义近些年来,混合语音信号分离成为信号处理领域的一个研究热点。在信号处理中我们经常遇到这样的问题,如何从一组未知的随机信号经过一组混合系统得到的观测信号种恢复出这些原始信号,如果重构过程中没有混合系统和原始信号的先验知识,我们就称该过程为盲分离。其理论也不断
8、运用到图像、通讯、医学等领域在语音方面的应用包括有多个人说话构成的声音环境下,从多个话筒接收到的声音信号就是所谓的鸡尾酒会问题,它是指人们在嘈杂环境中或者是在许多人同时说话的情况下有辨识自己感兴趣的声音的能力引起研究者的兴趣。而我们所研究的混合语音信号分离急速虽然不能失信是计算机具有和人类一样的听觉,但 是通过该技术却能使原本相互混叠的语音信号相互剥离,来作为语音识别的预处理,从而使得噪声环境下结合多说话人情形下的语音识别的实现成为可能。1.2语音噪声特性分析1.2.1 语音的特性(1)短时平稳性根据对语音信号的研究,语音是一种时变的、非平稳的随机过程,但另一方面,由于人类发声系统的生理结构的
9、变化速度是有一定限度的,在一段短时间内(1030ms)人的声带和声道形状基本稳定,并且大部分情况下,激励源参数也是如此,因此可认为短时间内语音特征是不变的,语音的短时性特点是对语音信号进行分析和处理的基础。(2)浊音和清音语音分为浊音和清音两大类,二者从语音产生的机理上有明显的差异,前者由周期性脉冲产生,后者由随机噪声产生,因而在特征上也有明显的区别。浊音在时域上呈现出明显的周期性,在频域上具有共振峰结构而且能量大部分集中在较低频段内。清音则完全不同,它没有明显的时域和频域特征,类似于白噪声。浊音在频谱上有共振峰结构,能量重要集中在低频区(1000Hz)。1.2.2语音信号的基本特征(1)语音
10、信号的时域特征由于说话人在不同时刻的说话内容千变万化,而且没有确定的规律性,因此语音信号是时变的。但由于人类的发声器官的变化速率有限,声道在短时间内(5500ms)处于平稳状态,因此语音信号具有短时平稳性。而这种短时平稳性,也是语音处理中许多理论和算法的必要前提。由于人们在说话时,各个音节或单词之间总会存在着时间上的间隔,因此语音信号在时域上存在着有音段和无音段。通过有音段和无音段的检测,可用去除带噪语音中平稳的噪声。此外,无音段所占比例越大,语音的稀疏性越好,利用这一特点,产生了许多基于语音稀疏性的增强算法。(2)语音信号的频域特征语音信号的频谱能量主要集中在300-3400Hz范围内。语音
11、本身由浊音和清音组成,浊音含有语音信号的大部分能量,其频谱分布主要集中在低频段中的基音频率及其各次谐波上,呈现出明显的周期性;清音则表现出随机性,在频谱上类似于白噪声。(3)语音信号的统计特征语音信号可以看作是一个遍历性随机过程的样本函数,其统计特性可用其幅度的概率密度函数来描述。对语音信号的统计特性的研究表明,其幅度分布的概率密度函数可以用两种近似的表达式来较好地描述,其中一种是伽马(Gamma)分布 (1-1)式中k是一个常数,与标准差仃,有下列关系 (1-2) 另一种是拉普拉斯分布(Laplacian)分布 (1-3)式中,口是一个由标准差仃。决定的常数,即 (1-4)相对说来,伽马分布
12、对语音信号的幅度分布描述更为精确一点,而拉普拉斯分布的函数形式则更加简洁。2 盲信号处理2.1 盲信号处理的基本概念盲信号处理是现代数学信号处理、算智能学近年来迅速发展的重要方向。电子信息、通信、生物医学、图像增强、雷达、地球物理信号处理等众多领域有广泛的应用前景。盲信号处理就是利用系统(如无线信道、通信系统等)的输出观测数据,通过某种信号处理的手段, 获得我们感兴趣的有关信息(如原来独立发射的信号等)。盲信号的研究是当前学术界的一个研究热点,而盲信号分离则是盲信号研究中的一个重要的课题。BSS是指从观测到的混合信号中分离出未知的源信号。盲信号中的“盲”意味着两个方面:第一,对源信号一无所知或
13、只有少许的先验知识。第二,混合本身是未知的。这看似是一个不可能的任务,然而理论和实际都证实了只需要相当简单的假设,就可以得到该问题的解。这一特点使得BSS成为一种功能相当强大的信息处理方法。混合矩阵分离矩阵噪声向量S(t)X(t)Y(t)图2.1.1 盲处理原理框图2.2 盲信号处理的方法和分类在盲信号处理中,就源信号进过传输通道的混合方式而言,其处理方法可分为线性瞬时混合信号盲处理、线性卷积混合信号盲处理和非线性混合信号盲处理三类。根据通道传输特性中是否含有噪声、噪声特性(白噪声、有色噪声等)、噪声混合形式,可分为有噪声、无噪声盲处理,含加性噪声和乘性噪声混合信号盲处理等。按源信号和观测信号
14、数目的不同可以将混合方式分为欠定 、适定和超定情况 ;按源信号特性的不同分为 : 平稳 、非平稳 、超高斯 、亚高斯 、超高斯和亚高斯混合分离等 。盲处理的目的可分为盲辨识和盲源分离两大类。盲辨识的目的是求得传输通道混合矩阵(新型混合矩阵、卷积混合矩阵、非线性混合矩阵等)。盲源分离的目的是求得源信号的最佳估计。当盲源分离的各分量相互独立时,就称为独立分量分析,即独立分量分析是盲源分离的一种特殊情况。2.3 盲信号处理技术的研究应用近年来,盲信号处理逐渐成为当今信息处理领域中热门的课题之一,并且已经在尤其在生物医学工程、医学图像、语音增强、遥感、通信系统、地震探测、地球物理学、计量经济学和数据挖
15、掘等领域显示出诱人的前景,特别是盲源分离技术、ICA的不断发展和应用最为引人注目。1.语音识别领域语音信号分离、语音识别是盲处理应用的一个重要领域。最典型的应用就是声控计算机,计算机所接受到的语音指令肯定是肯定是带有各种环境噪声的,还可能存在其他的语音信号(如有其他人说话),而且这些信号源与接收器的相对位置也未知,计算机需要在这种情况下识别出正确的语音命令。在移动通信中,往往存在通信质量问题,极大的影响了通话效果,而盲源分离或盲均衡技术能够消除噪声、抑制干扰及增强语音,提高通话质量。2.生物医学信号处理在生物医学领域,盲信号处理可应用于心电图(ECG)、脑电图(EEG)信号分离、听觉信号分析、
16、功能磁共振图像(FMRI)分析等。目前已经有一些学者将盲源分离技术成功地够应用于脑电图等信号的数据处理。3 盲源分离法3.1 盲源分离技术盲源信号分离(Blind Source Separation, BSS) 是20世纪90年代迅速发展起来的一个研究领域 。它具有可靠的理论基础和许多方面的应用潜力。其在生物医学工程 、医学图像 、语音增强 、遥感 、通信系统 、地震探测等领域有着广泛而诱人的前景 ,盲源分离成为信号处理和神经网络领域的研究热点 。 盲源分离是针对从检测的混合信号中估计或恢复源信号的问题提出的,是指源信号、传输通道特性未知的情况下,仅由观测信号和源信号的一些先验知识(如概率密度
17、)估计出源信号各个分量的过程。例如最著名的鸡尾酒会问题,仅根据多个麦克风检测信号分离或恢复出某种语音源信号。3.2 盲分离算法实现在实际的ICA盲分离算法应用中,一般有时是必需的对观测数据做一些预处理技术,如用主成分分析 ( PCA )降维和白化,用滤波器进行滤波降噪处理等。另外,由于恢复准则的局限以及先验知识的缺乏,盲信号分离方法只能得到源信号的波形,而无法确定信号的幅值以及信号之间的顺序。这两点都需要人为的制定规则(如规定信号的方差为1来确定幅值)来确定。 3.2.1 盲信号分离基本原理框图3.3 盲源分离技术的研究发展和应用1986 年,法国学者Jeanny Herault和Christ
18、ian Jutten提出了递归神经网络模型和基于Hebb学习律的学习算法,以实现2个独立源信号混合的分离。这一开创性的论文在信号处理领域中揭开了新的一章,即盲源分离问题的研究。其后二十几年来,对于盲信号分离问题,学者们提出了很多的算法,每种算法都 在一定程度上取得了成功。从算法的角度而言,BSS算法可分为批处理算法和自适应算法;从代数函数和准则而言,又分为基于神经网络的方法、基于高阶统计量的方法、基于互信息量的方法、基于非线性函数的方法等。尽管国内对盲信号分离问题的研究相对较晚,但在理论和应用方面也取得很大的进展。清华大学的张贤达教授在其 1996 年出版的时间序列分析高阶统计量方法一书中,介
19、绍了有关盲分离的理论基础,其后关于盲分离的研究才逐渐多起来。近年来国内各类基金支持了盲信号处理理论和应用的项目,也成立了一些研究小组。虽然盲源分离理论方法在最近20年已经取得了长足的发展,但是还有许多问题有待进一步研究和解决。首先是理论体系有待完善。实际采用的处理算法或多或少都带有一些经验知识,对于算法的稳定性和收敛性的证明不够充分。盲源分 离尚有大量的理论和实际问题有待解决,例如多维ICA问题、带噪声信号的有效分离方法、如何更有效地利用各种先验知识成功分离或提取出源信号、一般性 的非线性混合信号的盲分离、如何与神经网络有效地结合、源信号的数目大于观察信号的数目时ICA方法等。另外,盲源分离可
20、同其他学科有机结合,如模糊系 统理论在盲分离技术中的应用可能是一个有前途的研究方向;盲源分离技术与遗传算法相结合,可以减少计算复杂度,提高收敛速度。如何有效提高算法对源信号统计特性的学习和利用也需要进行深入研究。在硬件实现方面,盲分离问题也存在着极大的发展空间,例如用FPGA实现等。经过人们将近20年的共同努力,有关盲分离的理论和算法得到了较快发展,包括 盲分离问题本身的可解性,以及求解原理等方面的基本理论问题在一定程度上得到了解决,并提出了一些在分离能力、内存需求、计算速度等方面性能各异的 算 法。由于该问题的理论研究深度和算法实现难度都较大,目前对于盲分离的研究 仍然很不成熟,难以满足许多
21、实际应用需求,许多理论问题和算法实现的相应技术也有待进一步探索。3.4 独立成分分析独立分量分析 ( Independent Component Analy2sis , ICA)是由Herault和J utten在1983年提出,该方法不依赖与源信号类型相关的详细知识或信号传输系统特性的精确辨识,是一种有效的冗余取消技术,被广泛应用于盲源分离 ( blind source separation BSS)、特征提取和盲解卷、生理学数据分析语音信号处理、图像处理及人脸识别等领域。该方法根据代价函数的不同 ,可以得到不同的ICA算法,如信息最大化(infomax)算法、Fast ICA算法、最大熵(
22、 M E)和最小互信息( MM I)算法、极大似然(ML)算法等。在统计学中,独立成分分析或独立分量分析(Independent components analysis,缩写:ICA)是一种利用统计原理进行计算的方法。它是一个线性变换。这个变换把数据或信号分离成统计独立的非高斯的信号源的线性组合。独立成分分析是盲信号分离(Blind source separation)的一种特例。3.4.1 独立成分分析的定义ICA是一种用来从多变量(多维)统计数据里找到隐含的因素或成分的方法,被认为是主成分分析(Principal Component Analysis, PCA)和因子分析(Factor A
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息处理 综合 训练 设计 语音 信号 分离
链接地址:https://www.31ppt.com/p-4234561.html