基于模式匹配方式的语音识别技术.ppt
语音识别基础,上海交通大学计算机系吴亚栋E-mail:Tel:62932057,第四章 基于模式匹配方式的 语音识别技术,第四章 基于模式匹配方式的 语音识别技术,4.1 语音短点检测*4.2 失真侧度*4.3 动态时间规正法*(DTW:Dynamic Time Warping)4.4 基于DTW技术的语音识别方案*,设待识语音模式为T=accbac,参考模式为R=cbacabc,若a、b、c之间的距离分别为 d(a,b)=d(b,a)=2、d(a,c)=d(c,a)=3、d(b,c)=d(c,b)=1、d(a,a)=d(b,b)=c(c,c)=0 时,1)试用DTW法,在点阵图上画出最佳匹配路径,并计算出最佳匹配距离D(T,R);2)根据1)的结果,试用线条画出与之间的对应关系。提交时间:,第四章 回家作业,4.1 语音端点检测,4.1.1 语音端点检测的困难性-语音端点检测:从包含语音的一段信 号中确定出该语音的起始点及终止点。-由于背景噪声或人为呼吸等原因产生 的杂音,使得语音的端点比较模糊。4.1.2 采用能量及过零数参数的检测法*,4.2 失真侧度,4.2.1 距离侧度与失真侧度-数学上的距离(1)正值性 d(x,y)0;当x=y时,有d(x,y)=0;(2)对称性 d(x,y)=d(y,x);(3)三角形不等式性 d(x,y)=d(x,z)+d(z,y)。-失真侧度(1)正值性 D(x,y)0;当x=y时,有D(x,y)=0;(2)在频域中应具有物理意义。(3)在实际工程中能有效地计算。4.2.2 几种典型的失真侧独*,4.3 动态时间规正法(DTW),4.3.1 语音模式匹配的问题点-匹配时音长不一致问题-线性匹配与非线性匹配*4.3.2 DTW的原理*4.3.3 DTW的具体解法*,4.4 基于DTW技术的语音识别方案,词 汇 表:W(n),n=1,2,N参考模式:R(k),k=1,2,N待识模式:T-利用DTW算法,计算所有Dk(T,R(k)。-对所有Dk(T,R(k)求其最小值,该最小失真度所对应的下标 n 就为识别结果。n=argminDk k,采用能量及过零数参数的检测法,时间,ETL,ETU,ZT,N1 N2,NB NE,过零数Zj,能量Ej,N1,N1-25,时间,几种典型的失真侧度,不同音长的匹配距离(D3D2D1),动态时间规正法(DTW)的原理,动态时间规正法(DTW)的具体解法,min,动态时间规正法(DTW)的计算实例,min,FEDCBA,1 2 3 4,R,T,