HMM语音信号处理第5章.ppt
《HMM语音信号处理第5章.ppt》由会员分享,可在线阅读,更多相关《HMM语音信号处理第5章.ppt(49页珍藏版)》请在三一办公上搜索。
1、5.1概述5.2隐马尔科夫模型的引入5.3隐马尔科夫模型的定义5.4隐马尔科夫模型的基本算法5.5隐马尔科夫模型的各种结构类型5.6隐马尔科夫模型的一些实际问题,第5章 隐马尔科夫模型,5.1 概述,隐马尔可夫模型(HMM),作为语音信号的一种统计模型,今天正在语音处理各个领域中获得广泛的应用。由于Bell实验室Rabiner等人在80年代中期对HMM的深入浅出的介绍,使HMM为世界各国从事语音信号处理的研究人员所了解和熟悉,进而成为公认的一个研究热点。近几十年来,隐马尔可夫模型技术无论在理论上或是在实践上都有了许多进展。其基本理论和各种实用算法是现代语音识别等的重要基础之一。,5.2隐马尔科
2、夫模型的引入,HMM是一个输出符号序列的统计模型,具有N个状态,它按一定的周期从一个状态转移到另一个状态,每次转移时,输出一个符号。转移到哪一个状态,转移时输出什么符号,分别由状态转移概率和转移时的输出概率来决定。因为只能观测到输出符号序列,而不能观测到状态转移序列(即模型输出符号序列时,是通过了哪些状态路径,不能知道),所以称为隐藏的马尔可夫模型。,一个简单的三状态HMM的例子,物理过程分析:建立模型来描述这个序列的特征是非常重要的。如果在分析的区间内,信号是非时变的或平稳的,那么使用众所周知的线性模型来描述该信号就可以了。例如,语音信号在短时间(约1030ms)内认为是平稳的,所以,在一段
3、短时间内,就可以用一个全零点模型或极零点模型来描述它,这就是线性预测(LPC)模型。但整体来讲,语音信号是时变的,所以用模型表示时,其参数也是时变的。但是语音信号是慢时变信号,所以,简单的考虑方法是:在较短的时间内用线性模型参数来表示,然后,再将许多线性模型在时间上串接起来,这就是马尔可夫链(Markov链)。Markov链虽然可以描述时变信号,但不是最佳的和最有效的。,HMM既解决了用短时模型描述平稳段的信号,又解决了每个短时平稳段是如何转变到下一个短时平稳段的。HMM是由两个随机过程组成,一个随机过程描述状态和观察值之间的统计对应关系的,它解决了用短时模型描述平稳段的信号的问题;由于实际问
4、题比Markov链模型所描述的更为复杂,观察到的事件并不是如Markov链模型中与状态一一对应,所以HMM 通过另一组概率分布相联系的状态的转移统计对应关系来描述每个短时平稳段是如何转变到下一个短时平稳段的。语音识别的最大困难之一就是如何对语音的发音速率及声学变化建立模型。随着HMM被引入到语音识别领域中,这一棘手问题得到了较圆满地解决。HMM很好的描述了语音信号的整体非平稳性和局部平稳性,是一种较为理想的语音信号模型。,5.3隐马尔科夫模型的定义,离散Markov过程 Markov链是Markov 随机过程的特殊情况,即Markov链是状态和时间参数都离散的Markov过程。设在时刻t的随机
5、变量用、其观察值用 表示,则如果当 的前提下,的概率是如下式所示,则称其为n阶Markov过程,特别地,当如下式成立时,则称其为1阶Markov过程,又叫单纯Markov过程。系统在任一时刻所处的状态只与此时刻的前一时刻所处的状态有关。而且,为了处理问题方便,我们只考虑上式右边的概率与时间无关的情况,即:同时满足:这里 是当时刻t从状态i在时刻t+1到状态j的转移概率,当这个转移概率是与时间无关的常数时,又叫 是具有常数转移概率的Markov过程。表示从状态i到状态j的转移是可能的。对于任意的i,j都有 则这个Markov过程是正则的。,隐Markov模型HMM是一个双内嵌式随机过程:由两个随
6、机过程组成,一个是状态转移序列,它对应着一个单纯Markov过程。另一个是每次转移时输出的符号组成的符号序列。在语音识别的HMM中,相邻符号之间是不相关的(这当然不符合语音信号的实际情况,这也是HMM的一个缺点,对此,已经有许多改进的HMM被提出)。这二个随机过程,其中一个随机过程是不可观测的,只能通过另一个随机过程的输出观察序列观测。设状态转移序列为,输出的符号序列为,则在单纯Markov过程和相邻符号之间是不相关的假设下(即 和 之间转移时的输出观察值 和其他转移之间无关),有下式成立:,因为是隐Markov模型,把所有可能的状态转移序列都考虑进去,则有:这就是上面我们计算输出符号序列aa
7、b的输出概率时所用的方法。,HMM的基本元素 根据以上的分析,对于语音识别用HMM可以用下面六个模型参数来定义,即::模型中状态的有限集合,即模型由几个状态组成。设有N 个状态,。记t时刻模型所处状态为,显然。在球与缸的实验中的缸就相当于状态。:输出的观测值符号的集合,即每个状态对应的可能的观察值数目。记 个观察值为,记t时刻观察到的观察值为,其中。在球与缸实验中所选彩球的颜色就是观察值。,:状态转移概率的集合。所有转移概率可以构成一个转移概率矩阵,即:其中 是从状态 到状态 转移时的转移概率,且有,。在球与缸实验中,它指描述每次在当前选取得缸的条件下选取下一个缸的概率。,:输出观测值概率的集
8、合。,其中 是从状态 到状态 转移时观测值符号的输出概率。即缸中球的颜色 出现的概率。根据B可将HMM分为连续型和离散型HMM等。:系统初始状态概率的集合,:表示初始状态是 的概率,即,在球与缸实验中,它指开始时选取某个缸的概率。:系统终了状态的集合。这里需要说明的是,严格地说Markov模型是没有终了状态的概念的,只是在语音识别里用的Markov模型要设定终了状态。,HMM的三个基本问题,概率估计问题:给定模型 和观察序列,如何计算概率前向算法最优状态序列问题:Viterbi模型参数训练问题:如何调整模型参数最大化Baum-Welch,5.4 隐马尔可夫模型的基本算法,前向后向算法 前向-后
9、向算法(Forward-Backward,简称为F-B算法)是用来计算给定一个观察值序列 以及一个模型 时,由模型M产生出O的概率 前向算法 前向变量 可有下面的递推公式计算得到:,(1)初始化(2)递推公式(3)最后结果,后向算法后向变量 可由下面的递推公式计算得到:(1)初始化(2)递推公式(3)最后结果,The Viterbi Algorithm,To find the single best state sequence,q=(q1q2qT),for the given observation sequence O=(o1o2oT),we need to define the quan
10、tity,18,Viterbi Algorithm,That is,is the best score along a single path,at time t,which accounts for the first t observations and ends in state i,by induction we have,19,Viterbi Algorithm,The complete procedure for finding the best state sequence can now be stated as follows:1.Initialization,20,Vite
11、rbi Algorithm,2.Recursion3.Termination,21,Viterbi Algorithm,4.Path(state sequence)backtrackingIt should be noted that the Viterbi algorithm is similar in implementation to the forward calculation.,22,B.Alternative Viterbi Implementation,By taking logarithms of the model parameters,the Viterbi algori
12、thm of the preceding section can be implemented without the need for any multiplications,thus:,23,Viterbi Algorithm,0.Preprocessing,24,Viterbi Algorithm,1.Initialization2.Recursion,25,Viterbi Algorithm,3.Termination4.Backtracking,26,Baum-Welch 算法 这个算法实际上是解决HMM训练的,即HMM参数估计问题的。或者说,给定一个观察值序列,该算法能确定一个,使
13、 最大。Baum-Welch算法利用递归的思想,使 局部放大,最后得到优化的模型参数,Baum-Welch算法HMM_Training.ppt,5.5 隐马尔可夫模型的各种结构类型,按照HMM的状态转移概率矩阵(参数)分类 各态历经型或遍历型HMM(Ergodic HMM):严格的讲,所谓的遍历模型就是经过有限步的转移后,系统能达到任何一个状态。即系统从一个状态允许转移到任何一个状态。在某些应用系统中,常遇到的是一步遍历模型,即经过一步跳转,系统可达到任何一个状态。这样的HMM的状态转移矩阵中的每一个元素均为大于零的数,没有零元素。显然,各态历经型HMM不符合时间顺序的要求,因为它可以回到以前
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- HMM 语音 信号 处理
链接地址:https://www.31ppt.com/p-6507114.html