模式识别PPT课件2.3 正态分布时的统计决策.ppt
《模式识别PPT课件2.3 正态分布时的统计决策.ppt》由会员分享,可在线阅读,更多相关《模式识别PPT课件2.3 正态分布时的统计决策.ppt(96页珍藏版)》请在三一办公上搜索。
1、2.3 正态分布时的统计决策,正态分布概率密度函数的定义及性质 多元正态概型下的最小错误率贝叶斯判别函数和决策面,单变量正态分布 单变量正态分布概率密度函数定义为,2.3.1正态分布概率密度函数的定义及性质,2.3.1正态分布概率密度函数的定义及性质,随机变量x的期望,2为x的方差,标准差,k=1 P(-kx +k)=0.68k=2 P(-kx +k)=0.95k=3 P(-kx +k)=0.99p(x)N(,2),概率密度函数应满足下列关系式p(x)0 (x),2.3.1正态分布概率密度函数的定义及性质, 多元正态分布,多元正态分布的概率密度函数,2.3.1正态分布概率密度函数的定义及性质,
2、 多元正态分布,2.3.1正态分布概率密度函数的定义及性质,协方差矩阵总是对称阵,协方差矩阵为,协方差的各分量为:,2.3.1正态分布概率密度函数的定义及性质,协方差矩阵总是非负定阵。对于任意随机向量x,xTx是的二次型。如果对x0的一切x 有 xTx0 都成立,则称为非负定阵。若xTx0,则为正定阵。对于正定矩阵,各阶主子式非零(包括|0)。,2.3.1正态分布概率密度函数的定义及性质,多元正态分布的性质,参数和对分布的决定性等密度点的轨迹为一超椭球面 不相关性等价于独立性 边缘分布和条件分布的正态性线性变换的正态性 线性组合的正态性,2.3.1正态分布概率密度函数的定义及性质,参数和对分布
3、的决定性,多元正态分布被均值向量和协方差矩阵所完全确定。,均值向量由d个分量组成;协方差矩阵由于其对称性故其独立元素有,p(x)N(,),多元正态分布概率密度函数常记为,2.3.1正态分布概率密度函数的定义及性质,等密度点的轨迹为一超椭球面,从正态分布总体中抽取的样本大部分落在由和所确定的一个区域里。从一个以均值为中心的云团内的二维高斯分布中取出的样本。椭圆显示了等概率密度的高斯分布轨迹。,2.3.1正态分布概率密度函数的定义及性质,等密度点的轨迹为一超椭球面,2.3.1正态分布概率密度函数的定义及性质,等密度点的轨迹为一超椭球面,2.3.1正态分布概率密度函数的定义及性质,当指数项为常数时,
4、密度p(x)值不变,因此等密度点应是此式的指数项为常数的点,即应满足,证明上式的解是一个超椭球面,且它的主轴方向由阵的特征向量所决定,主轴的长度与相应的协方差矩阵的本征值成正比。在数理统计中上式所表示的数量:,等密度点的轨迹为一超椭球面,2.3.1正态分布概率密度函数的定义及性质,为x到的Mahalanobis距离的平方。所以等密度点轨迹是x到的Mahalanobis距离为常数的超椭球面。这个超椭球体大小是样本对于均值向量的离散度度量。可以证明对应于Mahalanobis距离为的超椭球体积是,其中Vd是d维单位超球体的体积。,等密度点的轨迹为一超椭球面,2.3.1正态分布概率密度函数的定义及性
5、质,对于给定的维数,样本离散度直接随 而变。,不相关性等价于独立性,不相关与独立的定义:若 Exi xj= ExiExj 则定义随机变量xi和xj是不相关的。若 p(xi,xj)= p(xi) p(xj) 则定义随机变量xi和xj是独立的。,2.3.1正态分布概率密度函数的定义及性质,一般情况下相关与独立的关系,独立性是比不相关性更强的条件,独立性要求p(xi,xj)= p(xi) p(xj) 对于xi和xj都成立。不相关性是两个随机变量的积的期望等于两个随机变量的期望的积,它反映了xi与xj总体的性质。若xi和xj相互独立,则它们之间一定不相关;反之则不一定成立。,2.3.1正态分布概率密度
6、函数的定义及性质,多元正态分布情况,对多元正态分布的任意两个分量xi和xj而言,若xi与xj互不相关,则它们之间一定独立。在正态分布中不相关性等价于独立性。就随机向量x=x1,x2,xnT进行证明。,2.3.1正态分布概率密度函数的定义及性质,证明:,根据xi与xj互不相关的定义,可求得:,i,j=1,2,d;ij,因此协方差矩阵就成为对角阵,2.3.1正态分布概率密度函数的定义及性质,因此,重要推论:如果多元正态随机向量x=(x1,xd)T的协方差阵是对角阵,则x的分量是相互独立的正态分布随机变量。,2.3.1正态分布概率密度函数的定义及性质,边缘分布和条件分布的正态性,多元正态分布的边缘分
7、布和条件分布仍然是正态分布。二元正态分布协方差矩阵及其逆矩阵-1为,2.3.1正态分布概率密度函数的定义及性质,根据边缘分布定义,2.3.1正态分布概率密度函数的定义及性质,其中由于,所以x1的边缘分布,就是说边缘分布p(x1)服从以均值为 方差为 的正态分布。,2.3.1正态分布概率密度函数的定义及性质,同理可以推出x2的边缘分布为,对于给定x1的条件下x2的分布,有定义 p(x2|x1) = p(x1,x2 ) / p(x1),2.3.1正态分布概率密度函数的定义及性质,同理可以写出给定x2条件下x1的分布,2.3.1正态分布概率密度函数的定义及性质,线性变换的正态性,多元正态随机向量的线
8、性变换仍为多元正态分布的随机向量。设具有均值向量为,正定协方差矩阵为的正态随机向量为x = x1,x2,xdT xEd,2.3.1正态分布概率密度函数的定义及性质,线性变换的正态性,若对x用线性变换矩阵A(A是非奇异(|A|0)作线性变换,y = Ax 则y服从以均值向量为A,协方差矩阵为AAT的多元正态分布。即p(y)N(A,AAT),2.3.1正态分布概率密度函数的定义及性质,线性变换的正态性,随机向量的变换设随机向量y是另一随机向量x的函数,即,若x、y的函数关系是一一对应的,则其概率密度间满足下面关系,2.3.1正态分布概率密度函数的定义及性质,线性变换的正态性,雅克比行列式,J表示变
9、换后体积微元的变化,Yn坐标系中体积微元 dy1dy2dyn=|J|dx1dx2dxn。|J|表示J的绝对值。,2.3.1正态分布概率密度函数的定义及性质,线性变换的正态性,当x和y只是线性变换时,2.3.1正态分布概率密度函数的定义及性质,线性变换的正态性,此时,J=|A|,|A|表示矩阵A的行列式。从而随机向量y的概率密度函数,|A|表示行列式|A|取绝对值。,2.3.1正态分布概率密度函数的定义及性质,线性变换的正态性,设x的均值向量为,协方差矩阵为,则y的均值向量为=E(y)=AE(x)=A,y的协方差阵为=E(y-)(y-)T) =AE(x-)(x-)TAT=AAT,2.3.1正态分
10、布概率密度函数的定义及性质,证明:,y = Ax, 即x=A-1y x的均值向量为,y的均值向量为 =A, 即=A-1 根据雅可比行列式的定义,有|J|=|A|,2.3.1正态分布概率密度函数的定义及性质,证明:,y的概率密度函数与x的概率密度函数之间的关系为,由于,2.3.1正态分布概率密度函数的定义及性质,2.3.1正态分布概率密度函数的定义及性质,即 p(y)N(A,AAT),根据线性变换的正态性可以说明,用非奇异阵A对x作线性变换后,原来的正态分布正好变成另一参数不同的正态分布。,2.3.1正态分布概率密度函数的定义及性质,2.3.1正态分布概率密度函数的定义及性质,图中特征空间中的一
11、个线性变换将一个任意正态分布变换成另一个正态分布。变换A将原分布变成分布N(AT,ATA);另一个线性变换,即由向量a决定的向某条直线的投影P,产生沿该直线方向的N(,2)分布。尽管这些变换产生一个不同空间中的分布,还是将它们显示在原x1x2空间中。一种白化变换,将产生一个圆周对称的高斯分布。,列向量是的正交本征向量,与本征值对应的对角矩阵,变换后的意义,由于是对称阵,根据线性代数知识总可以找到某个A使得变换后y的协方差阵AAT为对角阵,这就意味着y下的各个分量间是相互独立的(性质的推论),也就是说总可以找到一组坐标系,使各随机变量在新的坐标系中是独立的。这一性质对解决某些模式识别问题有着重要
12、意义。,2.3.1正态分布概率密度函数的定义及性质,线性组合的正态性,若x为多元正态随机向量,则线性组合,是一维的正态随机变量,其中 是与x同维的向量。,2.3.1正态分布概率密度函数的定义及性质,线性组合的正态性,证明,利用性质作线性变换y=ATx,则p(y)N(AT,ATA),其中 为非奇异阵,A1为d(d1)维的矩阵, 。,2.3.1正态分布概率密度函数的定义及性质,这时,根据性质,y是服从以均值向量AT,协方差阵ATA的多元正态分布。,又根据性质y的边缘分布的正态性,可以得出 服从正态分布,其概率密度函数为,2.3.1正态分布概率密度函数的定义及性质,根据最小错误率贝叶斯判别函数,在多
13、元正态概型(p(x|i)N(i,i),i=1,,c)下就可以立即写出其相应的表达式。判别函数为,2.3.2 多元正态概型下的最小错误率贝叶斯判别函数和决策面,决策面方程为,即,2.3.2多元正态概型下的最小错误率贝叶斯判别函数和决策面,这种情况中每类的协方差矩阵都相等,而且类内各特征间相互独立,具有相等的方差。下面再分二种情况讨论。先验概率P(i)与P(j)不相等此时各类的协方差矩阵,第一种情况,2.3.2多元正态概型下的最小错误率贝叶斯判别函数和决策面,从几何上看,相当于各类样本落入在以i为中心的同样大小的一些超球体内。由于,由于上式中的第二、三项与类别i无关,故可忽略,并将gi(x)简化为
14、,2.3.2多元正态概型下的最小错误率贝叶斯判别函数和决策面,判别函数gi(x)还可进一步简化:,是x的二次函数,2.3.2多元正态概型下的最小错误率贝叶斯判别函数和决策面,忽略与i无关的xTx,则判别函数为,其中,wi0为第i个方向的阈值或偏置。,2.3.2多元正态概型下的最小错误率贝叶斯判别函数和决策面,决策规则就是要求对某个待分类的x分别计算gi(x),i=1,c。若,则决策xk。,2.3.2多元正态概型下的最小错误率贝叶斯判别函数和决策面,P(i)=P(j)时的情况,如c个类别的先验概率P(i),i=1,c都相等,则可忽略,中的lnP(i)项,使最小错误率贝叶斯决策规则表达得相当简单。
15、,2.3.2多元正态概型下的最小错误率贝叶斯判别函数和决策面,P(i)=P(j)时的情况,若要对观察x进行分类,只要计算x到各类均值i的欧氏距离平方| xi|2,然后把x归于具有 的类。,这种分类器称为最小距离分类器。,2.3.2多元正态概型下的最小错误率贝叶斯判别函数和决策面,判别函数gi(x)是x的线性函数。判别函数为线性函数的分类器称为线性分类器(linear machine)。,2.3.2多元正态概型下的最小错误率贝叶斯判别函数和决策面,在i=2I 下,这个方程可改写为,wT(xx0) = 0,2.3.2多元正态概型下的最小错误率贝叶斯判别函数和决策面,满足wT(xx0) = 0式的x
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 模式识别PPT课件2.3 正态分布时的统计决策 模式识别 PPT 课件 2.3 正态分布 统计 决策
链接地址:https://www.31ppt.com/p-1424993.html