模式识别课件第三章概率密度估计打印.ppt
《模式识别课件第三章概率密度估计打印.ppt》由会员分享,可在线阅读,更多相关《模式识别课件第三章概率密度估计打印.ppt(96页珍藏版)》请在三一办公上搜索。
1、第三章 概率密度估计,3.0 引言3.1 参数估计3.2 非参数估计3.3 说明,3.0 引言,进行Bayes决策需要事先知道两种知识:各类的先验概率;观测向量的类条件概率密度。知识的获取(估计):一些训练数据;对问题的一般性的认识。,3.0 引言,3.0 引言,类的先验概率的估计(较容易):依靠经验;用训练数据中各类出现的频率估计。用频率估计概率的优点:无偏性;相合性;收敛速度快。,类条件概率密度的估计(非常难):概率密度函数包含了一个随机变量的全部信息概率密度函数可以是满足下面条件的任何函数,p(x)0,3.0 引言,概率密度估计的两种主要思路:参数估计:根据对问题的一般性的认识,假设随机
2、变量服从某种分布,分布函数的参数通过训练数据来估计。非参数估计:不用模型,而只利用训练数据本身对概率密度做估计。,3.0 引言,“Curse of dimensionality”:We need lots of training data to determine the completely unknown statistics for multi-D problems.A rule of thumb:“use at least 10 times as many training samples per class as the number of features(i.e.D)”Hence
3、,with some a priori information,it is possible to estimate the parameters of the known distribution by using less number of Samples,3.1 参数估计,3.1 参数估计,最大似然估计把参数看作是确定而未知的。最好的估计值是在获得实际观察样本的概率为最大的条件下得到的。贝叶斯估计把未知的参数当作具有某种分布的随机变量,样本的观察结果使先验分布转化为后验分布,再根据后验分布修正原先对参数的估计。,3.1 参数估计,最大似然估计(Maximum Likelihood),需
4、做以下假设:参数是确定(非随机)而未知的量。按类别把样本集分开,假定有c个类,则可分成c个样本集X1,X2,Xc,其中Xj中的样本都是从概率密度为p(x|j)的总体中独立抽取出来的。,3.1 参数估计,类条件概率密度p(x|j)具有某种确定的函数形式,但其参数向量 j 未知。假定Xi中的样本不包含关于j(ji)的信息。也就是说不同类别的参数在函数上是独立的。这样就可以分别对每一类进行处理。也就是说Xi中的样本只对i 提供有关信息,而没有关于j(ji)的任何信息。,3.1 参数估计,在假设前提下,可以分别处理c个独立的问题。独立地按照概率密度抽取样本集X,用X去估计出未知参数。已知某一类样本集X
5、包含有N个样本,即X=x1,x2,xN,3.1 参数估计,由于假设样本是独立抽取的,所以,相对于样本集X的的似然函数。,3.1 参数估计,似然函数:,对数似然函数:,等价,参数求解:梯度为0。,3.1 参数估计,最大似然估计示意图,3.1 参数估计,Find value of unknown parameter maximizes,For different,theobserved samples givesdifferent p(X|)valuesfor p(xk|)densities,The argument for themaximum of suchproducts is ML est
6、imate,log p(X|)will notdiffer the argument ofthis maxima,单变量正态分布,3.1 参数估计,正态分布假设下的极大似然参数估计:,其中 和 为未知参数。,由,单变量正态分布,知,3.1 参数估计,正态分布假设下的极大似然参数估计:,3.1 参数估计,以 和 代入上式,解上述方程组,得,多元正态分布似然函数:,3.1 参数估计,设x1,x2,xn是从p(x|,)选取的特征向量,其联合分布为,多元正态分布均值估计:,均值的最大似然估计与无关!,3.1 参数估计,多元正态分布协方差矩阵的估计:,3.1 参数估计,令,A=-1,正态分布假设下的极大
7、似然参数估计:多元正态分布协方差矩阵的估计:,3.1 参数估计,正态分布假设下的极大似然参数估计:多元正态分布协方差矩阵的极大似然估计是有偏估计:,无偏估计:,3.1 参数估计,Bayes估计:最大后验概率估计(maximum a posteriori),设有一个样本X(而不是x),要求找出估计量(而不是选出最佳决策),用来估计X所属总体的分布的某个真实参数(而不是真实状态k)使带来的贝叶斯风险最小,就是贝叶斯估计。,3.1 参数估计,Bayes估计:贝叶斯决策和贝叶斯估计两者都立足于使贝叶斯风险最小,只是要解决的问题不同:一是要决策x的真实状态,而另一个则是估计X所属总体分布的参数。二者的各
8、变量之间存在一一对应的关系,3.1 参数估计,Bayes估计:,3.1 参数估计,Bayes估计:,根据贝叶斯公式,3.1 参数估计,Bayes估计:,可得、x的联合分布,3.1 参数估计,Bayes估计:,为 可能取值的参数空间。,为给定x条件下估计量 的期望损失(条件风险),与贝叶斯决策中给定x时决策 的条件风险 是对应的。,3.1 参数估计,Bayes估计:,因此同贝叶斯决策一样:使条件风险 极小时的估计量 也一定使贝叶斯风险R最小。,如果 的估计量 使条件风险最小,则称 是关于 的贝叶斯估计量。,若求解贝叶斯估计量 必须定义适当的损失函数。,3.1 参数估计,Bayes估计:,一般地,
9、损失函数可定义成不同的形式,因而得到不同的贝叶斯估计量。,以二次函数作为损失函数,即平方误差损失函数,3.1 参数估计,Bayes估计:,定理:如果损失函数为二次函数,即 则 的贝叶斯估计量 是在给定x时 的条件期望。即,3.1 参数估计,Bayes估计:,证明:由于贝叶斯估计使贝叶斯风险R达到最小,要使贝叶斯风险,达到最小,相当于被积函数(条件风险),3.1 参数估计,Bayes估计:,3.1 参数估计,Bayes估计:,3.1 参数估计,Bayes估计:,选择,使第二项为零,从而使条件风险 最小,所以贝叶斯估计量为,3.1 参数估计,Bayes估计:,确定 的先验分布,利用此定理,可以对平
10、方误差损失函数求解贝叶斯估计量,步骤如下:,由样本集X=x1,x2,,xn求出样本联合分布,它是 的函数,利用贝叶斯公式,求出 的后验分布,3.1 参数估计,Bayes估计:,利用定理求出贝叶斯估计量,3.1 参数估计,Bayes估计举例:以单变量正态分布为例,并假定总体方差为已知,待估计的仅是均值。设总体分布密度为,3.1 参数估计,Bayes估计举例:,假定关于 的先验知识可用一个已知的先验密度 来表示,并假定 服从均值为 方差为 的正态分布,即,其中 和 是已知的。,表示 的最好的先验推测,度量了对这个推测的不确定性。,3.1 参数估计,Bayes估计举例:,设样本集X=x1,x2,xn
11、是取自 正态分布,其中 是未知参数,且假定 为随机参数,具有先验分布,要求用贝叶斯估计方法求出 的估计量。,3.1 参数估计,Bayes估计举例:对于二次损失函数的贝叶斯估计,根据定理,有,可得,3.1 参数估计,Bayes估计举例:,由 求得。,从上式可看出,首先是求 的后验分布,由于其先验分布 为已知,可应用贝叶斯公式,3.1 参数估计,Bayes估计:,其中,是一个比例因子,仅与X有关而与无关。,由于,3.1 参数估计,Bayes估计:,3.1 参数估计,Bayes估计:,和 无关的因子全部吸收到 和 中,这样 是 的二次函数的指数函数,仍是正态密度,可以把 写成,即,3.1 参数估计,
12、Bayes估计:,应用待定系数法,令上面两式对应的系数相等,即求得 和,3.1 参数估计,Bayes估计:解前面方程得,3.1 参数估计,3.1 参数估计,Bayes估计:,求 的贝叶斯估计,得出 的贝叶斯估计值,3.1 参数估计,Bayes估计:,假设先验分布 为标准正态分布,即=N(0,1),且总体分布的方差 也为1,则,与最大似然估计 有类似的形式,只是分母不同。,3.1 参数估计,Bayes估计:,通常 是mn和 线性组合,两者的系数均为非负,并且和为1。即,3.1 参数估计,位于mn和 的连线上。,Bayes估计:,如果 说明对先验估计非常不确定,用样本均值mn和代替了,3.1 参数
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 模式识别 课件 第三 概率 密度 估计 打印
链接地址:https://www.31ppt.com/p-6052514.html