《应用多元统计课件ch3.1.ppt》由会员分享,可在线阅读,更多相关《应用多元统计课件ch3.1.ppt(36页珍藏版)》请在三一办公上搜索。
1、1,第三章 多元正态总体参数的假设检验3.1 几个重要统计量的分布-Wishart分布的性质,性质4 分块Wishart矩阵的分布:设X()Np(0,)(1,n)相互独立,其中,又已知随机矩阵,则,2,第三章 多元正态总体参数的假设检验3.1 几个重要统计量的分布-Wishart分布的性质,性质5 设随机矩阵WWp(n,),记,则,相互独立。其中,(性质5,性质7和性质8不要求),3,第三章 多元正态总体参数的假设检验3.1 几个重要统计量的分布-Wishart分布的性质,性质6 设随机矩阵WWp(n,),则 E(W)n.,证明:由定义3.1.4,知,其中ZNp(0,)(=1,n)相互独立.则
2、,4,第三章 多元正态总体参数的假设检验3.1 几个重要统计量的分布-Hotelling T2分布,一元统计中,若XN(0,1),2(n),X与 相互独立,则随机变量,下面把 的分布推广到p元总体.,设总体XNp(0,),随机阵W Wp(n,),我们来讨论T2nXW-1 X的分布.,5,第三章 多元正态总体参数的假设检验3.1 几个重要统计量的分布-Hotelling T2分布,定义3.1.5 设XNp(0,),随机阵WWp(n,)(0,np),且X与W相互独立,则称统计量T2nXW-1 X 为Hotelling T2 统计量,其分布称为服从n个自由度的T2 分布,记为T2 T2(p,n).,
3、更一般地,若XNp(,)(0),则称T2 的分布为非中心Hotelling T2 分布,记为 T2 T2(p,n,).,6,第三章 多元正态总体参数的假设检验3.1 几个重要统计量的分布-Hotelling T2分布的性质,性质1 设X()Np(,)(1,n)是来自p元总体Np(,)的随机样本,X和A分别为总体Np(,)的样本均值向量和离差阵,则统计量,事实上,因,7,第三章 多元正态总体参数的假设检验3.1 几个重要统计量的分布-Hotelling T2分布的性质,而AWp(n-1,),且A与X相互独立.由定义 3.1.5知,8,第三章 多元正态总体参数的假设检验3.1 几个重要统计量的分布
4、-Hotelling T2分布的性质,性质2 T2与F分布的关系:设T2T2(p,n),则,在一元统计中,9,第三章 多元正态总体参数的假设检验3.1 几个重要统计量的分布-Hotelling T2分布的性质,当p=1时,一维总体XN(0,2),,所以 注意:因,这是性质2的特例:即p=1时,T2F(1,n).,10,第三章 多元正态总体参数的假设检验3.1 几个重要统计量的分布-Hotelling T2分布的性质,一般地:(性质2的严格证明见参考文献2),其中X-1 X2(p,)(0),还可以证明,2(n-p+1),且与独立.,11,第三章 多元正态总体参数的假设检验3.1 几个重要统计量的
5、分布-Hotelling T2分布的性质,性质3 设XNp(,),随机阵WWp(n,)(0,np),且X与W相互独立,T2nXW-1 X为非中心Hotelling T2 统计量(T2 T2(p,n,).,则,其中非中心参数.,12,第三章 多元正态总体参数的假设检验3.1 几个重要统计量的分布-Hotelling T2分布的性质,或 性质3 设X()Np(,)(1,n)是来自p元总体Np(,)的随机样本,X 和A分别为样本均值向量和离差阵.记,13,第三章 多元正态总体参数的假设检验3.1 几个重要统计量的分布-Hotelling T2分布的性质,一元统计中(p=1时),t 统计量与参数2无关
6、.类似地有以下性质.性质4 T2统计量的分布只与p,n有关,而与无关.即,14,第三章 多元正态总体参数的假设检验3.1 几个重要统计量的分布-Hotelling T2分布的性质,事实上,因XNp(0,)(0),WWp(n,),则-1/2XNp(0,Ip),,因此,15,第三章 多元正态总体参数的假设检验3.1 几个重要统计量的分布-Hotelling T2分布的性质,性质5 在非退化的线性变换下,T2统计量保持不变 设X()(1,n)是来自p元总体Np(,)的随机样本,Xx和Ax分别表示正态总体X的样本均值向量和离差阵,则由性质1有,16,第三章 多元正态总体参数的假设检验3.1 几个重要统
7、计量的分布-Hotelling T2分布的性质,令,其中C是pp非退化常数矩阵,d是p1常向量。则可证明:,17,第三章 多元正态总体参数的假设检验3.1 几个重要统计量的分布-Wilks 分布的定义,一元统计中,设2(m),2(n),且相互独立,则,在总体N(1,2(x)和N(2,2(y)方差齐性检验中,设X(i)(i=1,m)为来自总体N(1,2(x)的样本,Y(j)(j=1,n)为来自总体N(2,2(y)的样本.取2(x)和2(y)的估计量(样本方差)分别为,18,第三章 多元正态总体参数的假设检验3.1 几个重要统计量的分布-Wilks 分布的定义,检验统计量,p元总体Np(,)中,协
8、差阵的估计量为A/(n-1)或A/n.在检验H0:12时,如何用一个数值来描述估计矩阵的离散程度呢.一般可用矩阵的行列式、迹或特征值等数量指标来描述总体的分散程度.,19,第三章 多元正态总体参数的假设检验3.1 几个重要统计量的分布-Wilks 分布的定义,定义3.1.6 设XNp(,),则称协差阵的行列式|为X的广义方差.若X()(1,n)为p元总体X的随机样本,A为样本离差阵,有了广义方差的概念后,在多元统计的协差阵齐次检验中,类似一元统计,可考虑两个广义方差之比构成的统计量Wilks统计量的分布.,20,第三章 多元正态总体参数的假设检验3.1 几个重要统计量的分布-Wilks 分布的
9、定义,定义3.1.7 设A1Wp(n1,),A2Wp(n2,)(0,n1p),且A1与A2独立,则称广义方差之比,为Wilks(或)统计量,其分布称为Wilks(威尔克斯)分布,记为(p,n1,n2)(或p,n1,n2),21,第三章 多元正态总体参数的假设检验3.1 几个重要统计量的分布-Wilks 统计量的性质,在实际应用中,常把统计量化为T2统计量,进而化为F统计量,利用我们熟悉的F统计量来解决多元统计分析中有关检验的问题.,结论1 当n21时,设n1=np,则,注意:在这里记号(p,n,1)有两重含义:统计量(也是随机变量);其分布是参数为p,n,1的威尔克斯分布.,22,第三章 多元
10、正态总体参数的假设检验3.1 几个重要统计量的分布-Wilks 统计量的性质,或,证明 设X()(1,n,n+1)相互独立同Np(0,)分布,显然有,23,第三章 多元正态总体参数的假设检验3.1 几个重要统计量的分布-Wilks 统计量的性质,由定义3.1.7,知,24,第三章 多元正态总体参数的假设检验3.1 几个重要统计量的分布-Wilks 统计量的性质,利用分块矩阵求行列式的公式(见附录的推论4.1):,25,第三章 多元正态总体参数的假设检验3.1 几个重要统计量的分布-Wilks 统计量的性质,所以,结论2 当n22时,设n1np,则,26,第三章 多元正态总体参数的假设检验3.1
11、 几个重要统计量的分布-Wilks 统计量的性质,结论3 当p=1时,则,因p=1时,(1,n1,n2)就是(n1/2,n2/2)利用贝塔分布与F分布的关系,即有以上结论.,27,第三章 多元正态总体参数的假设检验3.1 几个重要统计量的分布-Wilks 统计量的性质,结论4 当p=2时,则,结论5 当n22,p2时,可用2统计量或F统计量近似.Box(1949)给出以下结论:,设(p,n,n2),则当n时,-rln2(p n2),其中r=n-(p-n2+1)/2.,(二个重要结论不要求),28,第三章 多元正态总体参数的假设检验3.1 几个重要统计量的分布-Wilks 统计量的性质,下面不加
12、证明地给出地二个重要结论:(1)若(p,n1,n2),则存在相互独立B1,Bp,Bk(k=1,p)使得,d,p=1时(1,n1,n2)就是(n1/2,n2/2).,(2),29,第三章 多元正态总体参数的假设检验3.2 单总体均值向量的检验,在多元统计分析中,考虑的总体是p维正态总体Np(,),关于均值向量的检验问题经常是需要的.p元正态随机向量的每一个分量都是一元正态变量,关于均值向量的检验问题能否化为 p个一元正态的均值检验问题呢?显然这是不完全的.因为p个分量之间往往有互相依赖的关系,分开作检验,往往得不出正确的结论.但我们可以构造出类似于一元统计中的统计量,用来对均值向量进行检验.,3
13、0,第三章 多元正态总体参数的假设检验3.2 单总体均值向量的检验,关于均值向量的检验包括:一个p元正态总体Np(,),检验 H0:0;二个p元正态总体Np(1,1)和Np(2,2),检验H0:12 k个p元正态总体Np(i,)(i1,k),当协差阵相等时检验k个均值向量是否全相等(即多元方差分析).,31,第三章 多元正态总体参数的假设检验3.2 单总体均值向量的检验,设总体XNp(,),随机样本X()(1,n).检验H0:0(0为已知向量),H1:0,1.当0已知时均值向量的检验,利用二次型分布的结论(“2.结论1”)知,32,第三章 多元正态总体参数的假设检验3.2 单总体均值向量的检验
14、,取检验统计量为,按传统的检验方法,对给定的显著水平,查2分布临界值表得:,33,第三章 多元正态总体参数的假设检验3.2 单总体均值向量的检验,由样本值x()(1,n),计算X及T20值,若T20,则否定H0,否则H0相容.,利用统计软件(如SAS系统),还可以通过计算显著性概率值(p值)给出检验结果,且由此得出的结论更丰富.假设在H0成立情况下,随机变量T20 2(p),由样本值计算得到T20的值为d,可以计算以下概率值:p=P T20 d,常称此概率值为显著性概率值,或简称为p值.,34,第三章 多元正态总体参数的假设检验3.2 单总体均值向量的检验,对给定的显著性水平,当p值时(即d值
15、大,X与偏差大),则在显著性水平下否定假设H0;在这种情况下,可能犯“以真当假”的第一类错误,且就是犯第一类错误的概率.当p值时(即d值小,X与偏差小),则在显著性水平下H0相容;在这种情况下,可能犯“以假当真”的第二类错误,且犯第二类错误的概率为=P T20|当=10,其中检验统计量T20 2(p,),非中心参数=n(1-0)(0)-1(1-0).,35,第三章 多元正态总体参数的假设检验3.2 单总体均值向量的检验,p值的直观含义可以这样看,检验统计量T20的大小反映X与0的偏差大小,当H0成立时T20 值应较小.现在由观测数据计算T20值为d;当H0 成立时统计量T20 2(p),由2分布可以计算该统计量d的概率值(即p值).,比如p值=0.02=0.05,表示在 0的假设下,观测数据中极少会出现T20的值大于等于d值的情况,故在0.05的水平下有足够的证据否定原假设,即认为与0 有显著地差异.,36,第三章 多元正态总体参数的假设检验3.2 单总体均值向量的检验,又比如当p值=0.22=0.05时,表示在0的假设下,观测数据中经常会出现T20的值大于等于d值的情况,故在0.05的水平下没有足够的证据否定原假设,即认为与0 没有显著地差异.,
链接地址:https://www.31ppt.com/p-5970209.html