语音信号的频域分析.ppt
《语音信号的频域分析.ppt》由会员分享,可在线阅读,更多相关《语音信号的频域分析.ppt(37页珍藏版)》请在三一办公上搜索。
1、国家“十一五”规划教材数字语音编码讲议同济大学电子与信息工程学院赵晓群编著机械工业出版社,2007年,第5章语音信号的频域分析5.1概述 语音感知与语谱特性关系密切,人对语谱特性更敏感。幅频谱特性相似的两段语音,感知相似。语谱具有语言声学意义,反应了重要的语音特征;如共振峰频率、带宽等。进行语音频谱分析是认识和处理语音信号的重要方法。Fourier 分析是有效手段,是语音的重要分析工具。语音是非平稳信号,源于发声器官的物理运动过程。在短时间段(如10 30 ms)内可认为是平稳的;用时间依赖处理方法分析处理。,短时 Fourier 分析(时间依赖 Fourier 变换):用稳态分析处理非平稳信
2、号的一种方法语音的频域分析:包括语音信号的频谱、功率谱、倒频谱、频谱包络等,常用频域分析方法:带通滤波器组法、Fourier 变换法、同态分析、线性预测法等。本章:带通滤波器组法、Fourier 变换法、频域基音检测、时-频表示,第5章语音信号的频域分析5.2基于滤波器组的频域分析 最早的频谱分析:滤波器组来实现。特点:简单、实时性好、受外界影响小。常用模拟滤波器实现,也可用数字滤波器实现。宽带带通滤波器:平坦特性,可粗略求取语音频谱,分辨率较低,相当于短时处理时窄窗情况。窄带带通滤波器:频率分辨率较高,相当于短时处理时宽窗较宽的情况。图5.1:滤波器组法频谱分析原理图。,第5章语音信号的频域
3、分析5.3短时 Fourier 变换(STFT)的定义和性质 5.3.1STFT 的定义语音序列是时变的。分段方法:加一个沿时间轴滑动的窗函数;通常窗的宽度有限;对应于不同的 n 值,窗处于不同位置;窗函数对语音信号的每个样本进行加权。图5.2:移动窗函数选取语音段的示意图 图中使用的是非矩形窗,时刻 n 位于窗的中心,x(m)的短时 Fourier 变换(STFT)Xn(ej)的定义:式中,w(n)是窗函数。为位于 n 处的窗口观察到的窗选语音短段的 Fourier 变换;n 取不同值时,取出不同的语音短段;Xn(ej)是频率 和时间 n 的函数;有时-频性。要求:STFT 存在,则对所有
4、n 值,一定绝对可和。因窗宽有限,或无限冲激响应窗函数,其有效宽度有限,故满足绝对可和。,根据 STFT,恢复原语音信号 x(m)的方法:式 的逆变换为:若w(0)0,由上式得:准确地恢复原信号的唯一约束条件是 w(0)0。,由STFT的谱 Xn(ej)求解 x(m)的 Fourier 变换 X(ej)方法。假设 x(m)和 w(m)的 Fourier 变换都存在,即:因 Xn(ej)是 x(m)w(n-m)的 Fourier 变换,则 Xn(ej)是 X(ej)与 ejnW(e-j)的卷积,即 为使 Xn(ej)准确代替 X(ej),移动窗的 W(ej)应是冲激函数;即要求移动窗无限宽。,注
5、意:由于语音是时变的,故其 Fourier 变换可能不存在。通常,窗函数是有限时宽,故窗选语音段可看成从无限长的基本性质延续不变的平稳信号中截取出来的;对于爆破音等暂态音,则可看成在窗外取值为零。若把X(ej)看成是基本性质在窗外延续不变或窗外取值为零的某个平稳信号的 Fourier 变换,则式 就是有意义的。观点:STFT 是平稳信号的 Fourier 变换经加窗平滑的结果。,5.3.2窗函数及窗宽对STFT的影响图5.3a:元音 i 的波形和短时频谱图。元音 i 的基音周期大约是 13 ms;短时频谱图有两种变化:快变化:周期性激励引起,基音频率的各次谐波;慢变化:声道共振特性引起,各共振
6、峰的频率和带宽。两个频谱图间的差别:矩形窗时:谐波各峰较尖锐,谱图较破碎(类似于噪声),主瓣较窄(较高频率分辨率);旁瓣较高,“泄漏”严重;Hamming 窗时:短时频谱平滑些。短时谱分析,Hamming 窗较普遍。,分析窗宽对短时频谱的影响:图5.4(a):元音 i 的波形和短时频谱图。窗宽 6.4 ms,元音 i 的基音周期大约是 13 ms;窗选语音段长不到一个基音周期,丢失了基音周期的信息;频的快变化(谐波频率)消失。频的慢变化(较宽的峰)保留,是声道的共振特性。矩形窗比 Hamming 时,呈现较多的细致结构,由于矩形窗比 Hamming 窗 具有更高的频率分辨率。,图5.3,5.4
7、(b):清辅音 j 短时频谱图。图5.3(b):窗较长,频率分辨率高,许多快变化,反映了激励源的白噪声特性随机起伏。矩形窗时,快变化尤为突出。仍然看出声道滤波器的共振特性。,5.3.3结论长窗具有较高的频率分辨率,较低的时间分辨率;短窗具有较低的频率分辨率,较高的时间分辨率;窗宽的选择需折衷考虑;语音的基音周期值范围很大,窗宽选择应考虑该因素。矩形窗和 Hamming 窗的频谱特性都具有低通的性质。截止频率处都较尖锐,当通带较窄时(窗较宽),频谱能很好逼近短时语音谱。窗越宽逼近效果越好。,第5章语音信号的频域分析5.4STFT的实现 STFT的定义:将窗函数的位置参数 n 看成是参变量,给定
8、n,是连续变量 的函数,为语音段的标准Fourier 变换 从不同角度来解释 STFT,可得不同的实现方法。线性滤波的角度:为参变量,给定 时,是 n 的函数。重写定义式:表明:卷积实现,w(n)与 x(n)e-jn,序列 x(n)e-jn 通过冲激响应为 w(n)的线性滤波器的输出 此时,看成是固定值。图5.5:STFT 的线性滤波实现,图5.5:STFT 的线性滤波实现图5.6:图5.5方案的实数运算 图5.6方案原理:设:则可计算:,令,代入式 将 用 m 表示,得:上式可用图5.7方案实现;图5.8:图5.7方案的实数运算(推导略),图5.8用实数实现图5.7的方框图,可推得:需要计算
9、Xn(ej)时,用图5.8实现简单;需要计算 an()、bn()时,用图5.6实现较简单。线性滤波实现 STFT 的主要优点:利用了成熟的线性滤波器的成果,实现方法非常简单。线性滤波分有限冲激响应的和无限冲激响应的、因果的和非因果的线性滤波方法,相应地,STFT 或时变频谱分析也可分成有限窗宽和无限窗宽、因果窗和非因果窗等类型。,第5章语音信号的频域分析5.5短时 Fourier 谱的取样STFT 谱:一维时变信号的二维时-频表示,n 和 的函数。采样定理:以不低于其最高频率两倍的取样频率取样,由样本准确恢复出原始信号。STFT 的取样:是一个更复杂的问题。在时-频变量 n 和 上同时进行,并
10、保证不产生混叠失真。,5.5.1时域取样 STFT线性滤波实现:图5.5示。w(n):窄带低通滤波器,带宽为 B。则:Xn(ej)的带宽也为 B。在时域内,以 2B 速率对 Xn(ej)取样,不产生混叠失真。Hamming 窗时:w(n)的带宽 B=2fs/N,(fs 取样频率,N 窗宽)时域内的取样频率 2B=4fs/N。例:设 N=100,fs=10 kHz,则取样频率400 Hz,语音信号每输入 25 个样本计算一次短时谱即可。多数实际窗函数,频带宽度 B 与 fs/N 成正比例,即:式中,k 为比例常数。Hamming 窗 k=2,矩形窗 k=1。在时域内,Xn(ej)的取样频率为:,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 语音 信号 分析
链接地址:https://www.31ppt.com/p-6609278.html