协方差及相关系数及其性质.ppt
一、基本概念,二、n 维正态变量的性质,4.3协方差与相关系数,对于二维随机变量(X,Y):,已知联合分布,边缘分布,对二维随机变量,除每个随机变量各自的概率特性外,相互之间还有某种联系,问题是用一个怎样的数去反映这种联系.,问题的提出,反映了随机变量 X,Y 之间的某种关系,1.定义,一.协方差和相关系数的定义,若D(X)0,D(Y)0,称,2.说明,3.协方差的计算公式,法1.若(X,Y)为离散型,已知pij,若(X,Y)为连续型,已知f(x,y),法2.,4.性质,求cov(X,Y)XY,例1 已知 X,Y 的联合分布为,解,解,例2 设(X,Y),求XY,结论,即X,Y 相互独立,X,Y 不相关,解,例3,1.问题的提出,二、相关系数的意义,解得,2.相关系数的意义,例4,解,(1)不相关与相互独立的关系,3.注意,相互独立,(2)不相关的充要条件,4.相关系数的性质,(1)证:由柯西一许瓦兹不等式知,所以|XY|1。,意义|XY|=1当且仅当Y跟X几乎有线性关系。这说明了相关系数的概率意义。XY是刻画X,Y之间线性相关程度。,(2)证:由柯西一许瓦兹不等式中等号成立()充要条件知,练习 设(X,Y)N(1,1;4,4;0.5),Z=X+Y,求 XZ,解,写为矩阵的形式:,称为随机变量(X1,X2)的协方差矩阵。,(1)二维随机向量的协方差矩阵 二维随机变量(X1,X2)有四个二阶中心矩(设他们存在),分别记为,三.协方差矩阵,(2)推广定义 设X=(X1,X2,Xn)为n维随机向量,并记i=E(Xi),,则称=(1,2,n)为向量X的数学期望或均值,称矩阵,为向量X的协方差矩阵。,例6:设(X,Y)N(1,2,12,22,),求向量(X,Y)的均值与协方差矩阵。解:E(X)=1,E(Y)=2,,所以(X,Y)的均值为=(1,2),(X,Y)协方差矩阵为,3.协方差矩阵的性质(1)协方差矩阵对角线上的元素Cii为Xi的方差即Cii=D(Xi)i=1,2,n;(2)协方差矩阵C为对称矩阵,即Cij=Cji,i,j=1,2,n;(3)C为非负定矩阵,即对于任意实向量t=(t1,t2,tn),有tCt0;,证:性质(1),(2)显然,只证(3),4多维正态分布及其性质 二维正态随机向量X=(X1,X2)的概率密度为,引入下面记号,经运算可得,于是X=(X1,X2)的概率密度可写成,上式推广至n维正态分布的情况,于是有以下定义:,(1)定义 若n维随机向量X=(X1,Xn)的概率密度为,其中X=(X1,Xn),=(1,2,n)为n维实向量,C为n阶正定对称矩阵,则称向量X=(X1,Xn)服从n维正态分布,记为XN(,C).,对于n维正态分布XN(,C),X的期望为,X的协方差矩阵为C。,(2)性质(P179页)n维正态分布具有下述性质:1)n维随机向量(X1,Xn)服从n维正态分布充要条件是X1,Xn的任意线性组合l1X1+l2X2+lnXn(l1,l2,ln是不全为0的数)服从一维正态分布。,2)若X=(X1,Xn)N(,C),设Y=(Y1,Y2,Ym)=AX,即Yi为Xj(j=1,2,n)的线性函数,i=1,2,m,则YN(A,ACA),其中A为m行n列且秩为m的矩阵。,3)设(X1,Xn)服从n维正态分布,则“X1,Xn相互独立”与“X1,Xn两两不相关”是等价的。,例7:设XN(0,1),YN(0,1),若X与Y相互独立,求E(|X-Y|)。,于是,解:令Z=X-Y,问题化为求E(|Z|),为求E(|Z|),我们先求出Z的概率密度.,由于(X,Y)服从二维正态分布,由性质1)知Z服从一维正态分布,,而E(Z)=E(X-Y)=E(X)-E(Y)=0,D(Z)=D(X-Y)=D(X)+D(Y)=2,故ZN(0,2),即Z的概率密度为,例8:设,问X与Z是 否独立?,解:由于,由性质2)知(X,Z)服从二维正态分布,再由性质3)知判断X与Z是否独立等价于判断X与Z是否不相关。,D(X)=32,D(Y)=42,XY=-1/2,于是XZ=0,所以X与Z不相关,由此可得X与Z相互独立。,小结:1.结论1:X与Y相互独立 XY=0 X与Y不相关;反之,XY=0 不能推出X与Y相互独立。结论2:对任意X与Y,以下结论等价XY=0 Cov(X,Y)=0 E(XY)=E(X)E(Y)D(X+Y)=D(X)+D(Y)。结论3:若(X,Y)N(1,2,12,22,),则X与Y相互独立 XY=0 X与Y不相关。,2.由于正态分布在概率论中有其特殊地位,因此 对多维正态分布的性质及其应用要较好地掌握。,