第9章EM算法及其推广解析ppt课件.ppt
《第9章EM算法及其推广解析ppt课件.ppt》由会员分享,可在线阅读,更多相关《第9章EM算法及其推广解析ppt课件.ppt(26页珍藏版)》请在三一办公上搜索。
1、第9章 EM算法及其推广,EM算法是一种迭代算法,1977年由Dempster 等人总结提出,用于含有隐变量的概率模型参数的极大似然估计,或极大后验概率估计。EM算法的每次迭代由两步组成:E步,求期望;M步,求极大。所以这一算法称为期望极大算法(Expectation Maximization),简称EM算法。,极大似然估计,极大似然估计是概率论在统计学中的应用,它是参数估计的方法之一。说的是已知某个随机样本满足某种概率分布,但是其中具体的参数不清楚,参数估计就是通过若干次实验,观察其结果,利用结果推出参数的大概值。,极大似然估计,似然函数:已知样本集X,X是通过概率密度p(x|)抽取。样本集
2、X中各个样本的联合概率:为了便于分析,由于L()是连乘的,还可以定义对数似然函数,将其变成连加的:,极大似然估计,求极值可以转换为以下方程:的极大似然估计量表示为:,9.1 EM算法的引入9.1.1EM算法9.1.2EM算法的导出9.1.3EM算法在非监督学习中的应用9.2 EM算法的收敛性,9.1.1 EM算法,例9.1(三硬币模型)假设有3枚硬币,分别记作A,B,C.这些硬币正面出现的概率分别是,p,q.进行如下掷硬币试验:先掷硬币A,根据其结果选出硬币B或硬币C,正面选硬币B,反面选硬币C;然后掷选出的硬币,掷硬币的结果,出现正面记作1,出现反面记作0;独立地重复n次试验(这里,n=10
3、),观测结果如下:1,1,0,1,0,0,1,0,1,1假设只能观测到掷硬币的结果,不能观测掷硬币的过程。问如何估计三硬币正面出现的概率,即三硬币模型的参数。,解 三硬币模型可以写作y:观测变量,表示一次试验观测的结果是1或0z:隐变量,表示未观测到的掷硬币A的结果:=(,p,q)是模型参数,将观测数据表示为Y=(Y1,Y2,Yn)T,未观测数据表示为Z=(Z1,Z2,Zn)T,则观测数据的似然函数为即考虑求模型参数=(,p,q)的极大似然估计,即,EM算法首先选取参数的初值,记作,然后通过下面的步骤迭代计算参数的估计值,直至收敛为止。第i次迭代参数的估计值为。EM算法的第i+1次迭代如下E步
4、:计算在模型参数 下观测数据yj 来自掷硬币B的概率那么观测数据yj 来自硬币C的概率为1-(i+1),M步:先写出期望然后分别求导,计算模型参数的新估计值,假设模型参数的初值取为由E步公式对yj=1与yj=0均有j(1)=0.5利用M步迭代公式,得到继续计算j(2)=0.5,j=1,2,10继续迭代,得于是得到模型参数的极大似然估计:EM算法与初值的选择有关,选择不同的初值可能得到不同的参数估计值。如果取初值那么得到的模型参数的极大似然估计是,算法9.1(EM算法)输入:观测变量数据Y,隐变量数据Z,联合概率分布P(Y,Z|),条件概率分布P(Z,Y|);输出:模型参数.(1)选择参数的初值
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- EM 算法 及其 推广 解析 ppt 课件
链接地址:https://www.31ppt.com/p-2105533.html