《多元正态分布的假设检验法分析课件(82张).ppt》由会员分享,可在线阅读,更多相关《多元正态分布的假设检验法分析课件(82张).ppt(81页珍藏版)》请在三一办公上搜索。
1、多元正态分布的假设检验,多元正态分布的假设检验,4.1 单个总体均值向量的推断,4.1 单个总体均值向量的推断,多元正态分布的假设检验法分析课件(-82张),多元正态分布的假设检验法分析课件(-82张),多元正态分布的假设检验法分析课件(-82张),多元正态分布的假设检验法分析课件(-82张),多元正态分布的假设检验法分析课件(-82张),多元正态分布的假设检验法分析课件(-82张),多元正态分布的假设检验法分析课件(-82张),多元正态分布的假设检验法分析课件(-82张),多元正态分布的假设检验法分析课件(-82张),多元正态分布的假设检验法分析课件(-82张),proc iml; n=20
2、; p=3; x=3.7 48.5 9.3 ,5.7 65.1 8.0 ,3.8 47.2 10.9 , 3.2 53.2 12.0 ,3.1 55.5 9.7 ,4.6 36.1 7.9 , 2.4 24.8 14.0 ,7.2 33.1 7.6 ,6.7 47.4 8.5 , 5.4 54.1 11.3 ,3.9 36.9 12.7 ,4.5 58.8 12.3 , 3.5 27.8 9.8 ,4.5 40.2 8.4 ,1.5 13.5 10.1 , 8.5 56.4 7.1 ,4.5 71.6 8.2 ,6.5 52.8 10.9 , 4.1 44.1 11.2 ,5.5 40.9 9
3、.4 ; m0=4 50 10; ln=20 1 ; x0=(ln*x)/n; print x0; xm=x0-m0; print xm; mm=i(20)-j(20,20,1)/n; a=x*mm*x; print a; ai=inv(a); print ai; dd=xm*ai*xm; d2=(n-1)*dd; t2=n*d2; f=(n-p)*t2/(n-1)*p); print dd d2 t2 f; p0=1-probf(f,p,n-p); print p0; fa=finv(0.95,p,n-p); beta=probf(fa,p,n-p,t2); print fa beta;qu
4、it;,proc iml;,The SAS System 08:48 Wednesday, March 10, 2008 4 X0 4.64 45.4 9.965 XM 0.64 -4.6 -0.035 A 54.708 190.19 -34.372 190.19 3795.98 -107.16 -34.372 -107.16 68.9255 AI 0.0308503 -0.001162 0.0135773 -0.001162 0.0003193 -0.000083 0.0135773 -0.000083 0.0211498 DD D2 T2 F 0.0256283 0.4869386 9.7
5、387729 2.9045463 P0 0.0649283 FA BETA 3.1967768 0.3616381,多元正态分布的假设检验法分析课件(-82张),二 单个总体均值分量间结构关系的检验,是取自该总体的样本。检验:,1、问题引入,例 设,二 单个总体均值分量间结构关系的检验是取自该总体的样本。检,与上面的假设等价的是,寻找常数矩阵,与上面的假设等价的是,寻找常数矩阵,注:矩阵C不是唯一的,,注:矩阵C不是唯一的,,在例4.2.1中,假定人类的体形有这样一个一般规律的身高、胸围和上臂围平均尺寸比例为6:4:1。检验比例是否符合这一规律。检验:,在例4.2.1中,假定人类的体形有这样一
6、个一,则上面的假设可以表达为,则上面的假设可以表达为,2、统计量及方法,其中C为一已知的kp阶矩阵,kp,rank(C)=K,为已知的K维向量。根据多元正态分布的性质可知,检验:,S为协方差矩阵,2、统计量及方法检验:S为协方差矩阵,当 为真时,,故可以将霍特林分布的统计量换算成F统计量。,当 为真时,故可,对给定的显著性水平,检验的规则,对给定的显著性水平,检验的规则,某地区农村男婴的体格测量数据如下,检验三个指标的均值是否有关系,某地区农村男婴的体格测量数据如下编号身高(cm)胸围(cm),多元正态分布的假设检验法分析课件(-82张),proc iml;s= 31.600 8.040 0.
7、500, 8.040 3.172 1.310, 0.500 1.310 1.900;mu=82.00 60.20 14.50;c=2 -3 0, 1 0 -6;a=c*t(mu);d=c*s*t(c);g=inv(d);T=6#(t(a)*g*a);f=(6-2)/(2*(6-1)*T;Print T, f ; p0=1-probf(f,2,6-2); print p0;fa=finv(0.95,2,6-2); print fa;Quit;,T47.143,proc iml;T47.143,The SAS System 08:48 Wednesday, March 10, 2008 18 T
8、47.143404 F 18.857362 P0 0.0091948 FA 6.9442719,The SAS System 08:48 W,4.2 两个总体均值的检验,一、两个独立样本的情形,与一元随机变量的情形相同,常常我们需要检验两个总体的均值是否相等。,设从总体 ,中各自独立地抽取样本 和 , 。,考虑假设,4.2 两个总体均值的检验一、两个独立样本的情形,根据两个样本可得1和2的无偏估计量为,其中,根据两个样本可得1和2的无偏估计量为其中,当原假设为真的条件下,,检验的规则为:,当原假设为真的条件下,检验的规则为:,多元正态分布的假设检验法分析课件(-82张),多元正态分布的假设检验
9、法分析课件(-82张),多元正态分布的假设检验法分析课件(-82张),多元正态分布的假设检验法分析课件(-82张),data d331; input type x1-x4; cards; 1 65 35 25 60 1 75 50 20 55 1 60 45 35 65 1 75 40 40 70 1 70 30 30 50 1 55 40 35 65 1 60 45 30 60 1 65 40 25 60 1 60 50 30 70 1 55 55 35 75 2 55 55 40 65 2 50 60 45 70 2 45 45 35 75 2 50 50 50 70 2 55 50 30
10、 75 2 60 40 45 60 2 65 55 45 75 2 50 60 35 80 2 40 45 30 65 2 45 50 45 70 ; proc iml; n=10;m=10; p=4; use d331(obs=10); xx=x1 x2 x3 x4; read all var xx into x; print x; ln=10 1 ; x0=(ln*x)/n; print x0; mx=i(n)-j(n,n,1)/n; a1=x*mx*x; print a1;,data d331;,use d331(firstobs=11); read all var xx into y;
11、 print y; lm=10 1 ; y0=(lm*y)/m; print y0; my=i(m)-j(m,m,1)/m; a2=y*my*y; print a2; a=a1+a2; xy=x0-y0; ai=inv(a); print a ai; dd=xy*ai*xy; d2=(m+n-2)*dd; t2=n*m*d2/(n+m) ; f=(n+m-1-p)*t2/(n+m-2)*p); print d2 t2 f; pp=1-probf(f,p,m+n-p-1); print pp; quit;,use d331(firstobs=11);,The SAS System 08:48 W
12、ednesday, March 10, 2008 20 X 65 35 25 60 75 50 20 55 60 45 35 65 75 40 40 70 70 30 30 50 55 40 35 65 60 45 30 60 65 40 25 60 60 50 30 70 55 55 35 75 X0 64 43 30.5 63 A1 490 -170 -120 -245 -170 510 10 310 -120 10 322.5 260 -245 310 260 510,The SAS System 08:48,Y 55 55 40 65 50 60 45 70 45 45 35 75 5
13、0 50 50 70 55 50 30 75 60 40 45 60 65 55 45 75 50 60 35 80 40 45 30 65 45 50 45 70 Y0 51.5 51 40 70.5 A2 502.5 60 175 -7.5 60 390 50 195 175 50 450 -100 -7.5 195 -100 322.5,A AI 992.5 -110 55 -252.5 0.0011142 -0.000091 -0.00016 0.0004239 -110 900 60 505 -0.000091 0.0016972 0.0000975 -0.001076 55 60
14、772.5 160 -0.00016 0.0000975 0.0013754 -0.000372-252.5 505 160 832.5 0.0004239 -0.001076 -0.000372 0.0020539 D2 T2 F 5.9724991 29.862495 6.2213532 PP 0.0037058,A,二、成对试验的T2统计量,前面我们讨论的是两个独立样本的检验问题,但是不少的实际问题中,两个样本的数据是成对出现的。例如当讨论男女职工的工资收入是否存在差异;一种新药的疗效等。,思考:两独立样本和成对样本的观测值有何不同。,二、成对试验的T2统计量 前面我们讨论的是两个独立样
15、本,设(xi,yi),i=1,2,3,n,时成对的试验数据,由于总体X和Y均服从p维正态分布,且协方差相等。,假设检验,设(xi,yi),i=1,2,3,n,时成对的试验,检验的统计量为,其中,当原假设为真时,检验的统计量为 其中,例1 一组学生共5人,采用两种不同的方式进行教学, 然后对5个学生进行测验,得如下得分数:,分析不同的教学方式是否有差异。,例1 一组学生共5人,采用两种不同的方式进行教学, 然后,data a;input x1 x2 y1 y2;cards;89 90 82 85 98 88 80 83 75 69 61 70 76 70 6766 90 76 63 65;dat
16、a d;set a;x12=x1-y1;y12=x2-y2;proc corr cov;var x12 y12;run;proc iml;s= 63.50 21.000, 21.00 18.200;mu= 15.00, 4.800;g=inv(s);r=t(mu)*g*mu;print r;run;,data a;,4.3 两个总体均值分量间结构关系的检验,一、问题提出,设从总体 ,中各自独立地抽取样本 和 , 。他们的均值向量差为:,4.3 两个总体均值分量间结构关系的检验 一、问题,例 在爱情和婚姻的调查中,对一个由若干名丈夫和妻子组成的样本进行了问卷调查,请他们回答以下几个问题:(1)你
17、对伴侣的爱情的“热度”感觉如何?(2)伴侣对你的爱情的“热度”感觉如何?(3)你对伴侣的爱情的“可结伴”水平感觉如何?(4)伴侣对你的爱情的“可结伴”水平感觉如何? 回答采用没有、很小、有些、很大和非常大5个等级,得到结果如表。,例 在爱情和婚姻的调查中,对一个由若干名丈,丈夫对妻子妻子对丈夫 X1 X2 X3 X4 X1 X2 X,现在我们关心均值分量间的差异是否满足某种结构关系。比如每个指标均值间的差异是否相等。 1、丈夫对妻子以及妻子对丈夫的回答在0.05显著水平上没有差异。 2、在四个指标上他们是否会有相同的分数。即检验四个分数的平均值是否相等。,现在我们关心均值分量间的差异是否满足某
18、种结构,二、统计量与检验,检验,在原假设为真的条件下,检验的统计量为:,二、统计量与检验 检验 在原假设为真的条件下,检验,data a;input x1 x2 x3 x4 class;cards;数据行省略;run;proc anova;class class;model x1-x4=class;manova h=class m=(1 -1 0 0 , 1 0 -1 0 , 1 0 0 -1);run;,data a;,H = Anova SSCP Matrix for class E = Error SSCP Matrix S=1 M=0.5 N=27 Statistic Value F
19、Value Num DF Den DF Pr F Wilks Lambda 0.87857261 2.58 3 56 0.0626 Pillais Trace 0.12142739 2.58 3 56 0.0626 Hotelling-Lawley Trace 0.13820985 2.58 3 56 0.0626 Roys Greatest Root 0.13820985 2.58 3 56 0.0626,H = Anova SSCP Matrix for cla,proc iml;sigma1=0.5758620690 0.3758620690 -.1034482759 -.1655172
20、414, 0.3758620690 0.5850574713 -.0919540230 -.1586206897, -.1034482759 -.0919540230 0.4367816092 0.4137931034, -.1655172414 -.1586206897 0.4137931034 0.4551724138;mu1= 3.90000, 3.96667, 4.33333, 4.40000; sigma2= 0.4885057471 -.0172413793 0.0402298851 0.0229885057, -.0172413793 0.4379310345 0.0724137
21、931 0.1172413793, 0.0402298851 0.0724137931 0.2402298851 0.2022988506, 0.0229885057 0.1172413793 0.2022988506 0.2574712644; mu2= 3.83333, 4.10000, 4.63333, 4.53333;c=1 -1 0 0 , 1 0 -1 0 , 1 0 0 -1;mu=(mu1+mu2)/2;a=c*mu;sigma=29#(sigma1+sigma2)/58;t2=60#t(a)*inv(c*sigma*t(c)*a;print t2;,proc iml;,多元正
22、态分布的假设检验法分析课件(-82张),第一节 单因素方差分析,问题的提出统计的模型及检验方法多重比较检验,第一节 单因素方差分析问题的提出,问题的提出,问题的提出,某工厂实行早、中、晚三班工作制。工厂管理部门想了解不同班次工人劳动效率是否存在明显的差异。每个班次随机抽出了7个工人,得工人的劳动效率(件/班)资料如表。分析不同班次工人的劳动效率是否有显著性差异。 a=0.05,0.01。,某工厂实行早、中、晚三班工作制。工厂管理部,为什么各值 会有差异?可能的原因有两个。,一是,各个班次工人的劳动效率可能有差异,从而导致了不同水平下的观察值之间差异,即存在条件误差。,二是,随机误差的存在。,如
23、何衡量两种原因所引起的观察值的差异?,总平均劳动效率为:,为什么各值 会有差异?可能的原因有两个。,三个班次工人的平均劳动效率分别为:,总离差平方和ss,组间离差平方和(条件误差)ssA,三个班次工人的平均劳动效率分别为:总离差平方和ss组间离差平,组内离差平方和(随机误差)sse,统计量F,组内离差平方和(随机误差)sse 统计,把计算的F值与临界值比较,当F F时,拒绝原假设,不同水平下的效应有显著性差异;当F F 时,接受原假设。,NEXT,把计算的F值与临界值比较,方 差 离差平方和自由度方差F值,查F分布表得临界值因为 故应拒绝原假设,即不同班次工人的劳动效率有显著的差异。,方差分析
24、:比较3个或3个以上的总体均值是否有显著性差异。用组间的方差与组内方差相比,据以判别误差主要源于组间的方差(不同组工人的产量,条件误差),还是源于组内方差(随机误差)。,NEXT,查F分布表得临界值 方差分析:比较3个或3个以上的,50家上市公司,按行业计算其1999年底的资产负债情况,如下:,50家上市公司,按行业计算其1999年底的资,多重比较检验,1、多重比较检验 前面的F检验只能说明在单一因素的影响下,不同水平是否存在显著性的差异,但不能断言哪些总体之间存在差异,在方差分析中否定了原假设,并不意味着接受了假设:,因而还应该进一步讨论到底是哪些总体之间存在差异。,多重比较检验 1、多重比
25、较检验因而还应该,Scheffe检验,检验的结论:,Scheffe检验检验的结论:,第二节 多元方差分析,一、假设,第二节 多元方差分析一、假设,二、多元方差分析的离差平方和的分解,总离差平方和,二、多元方差分析的离差平方和的分解总离差平方和,多元正态分布的假设检验法分析课件(-82张),由于交叉乘积项为零,故组间叉积矩阵组内叉积矩阵总叉积矩阵,组内叉积矩阵:主要由随机因素构成,组间叉积矩阵:主要由系统因素构成,由于交叉乘积项为零,故组内叉积矩阵:主要由随机因素构成组间叉,SSE和SSA之和等于总离差平方和SST。当SSE在SST中占有较大的份额时,可以认为随机因素影响过大,反之SSE所占份额
26、小,SSA所占份额就大,不同试验间的观测值会有显著性差异。,三、统计量,SSE和SSA之和等于总离差平方和SST。,对给定的显著性水平,检验规则为:,拒绝原假设;,接受原假设;,注:关于统计量与F统计量的换算,参看附录。,对给定的显著性水平,检验规则为:拒绝原假设;接受原假设;注,多元正态分布的假设检验法分析课件(-82张),多元正态分布的假设检验法分析课件(-82张),多元正态分布的假设检验法分析课件(-82张),多元正态分布的假设检验法分析课件(-82张),多元正态分布的假设检验法分析课件(-82张),多元正态分布的假设检验法分析课件(-82张),多元正态分布的假设检验法分析课件(-82张
27、),多元正态分布的假设检验法分析课件(-82张),例4.6.1,有四种不同的商品x1,x2,x3和x4,按三种不同的方式销售,有数据如程序数据行,检验三种消费方式是否有显著性差异。,例4.6.1 有四种不同的商品x1,x2,x3和x,proc iml;csscp=49290.8500 8992.2500 -36444.0000 28906.8000, 8992.2500 9666.5833 -4658.3333 4859.0000,36444.0000 -4658.3333 429509.3333 -58114.0000,28906.8000 4859.0000 -58114.0000 175
28、644.4000; mu1=90.80000 58.65000 404.50000 230.65000; mu2= 72.90000 51.45000 417.75000 253.15000; mu3= 94.15000 55.15000 403.75000 292.00000; mu= 85.95000 55.08333 408.66667 258.60000; bcsscp=20#(t(mu1-mu)*(mu1-mu)+t(mu2-mu)*(mu2-mu)+t(mu3-mu)*(mu3-mu);icsscp=csscp-bcsscp;ht=det(csscp);hi=det(icsscp)
29、;lamda=hi/ht;print lamda;,proc iml;,1.地域文化因历史悠久,富有人文内涵,在今天仍发挥重要作用,因而颇受老百姓喜爱。2.在当下,地域文化不仅丰富了人们的精神生活,而且直接促进了社会生产力的快速发展。3.大力发展文化产业,形成地域与文化、经济互促式发展模式,需要多个方面的积极参与。4.加强历史文物古迹保护、恢复还原古景、开发历史人文景观等是彰显地域文化魅力的重要途径。5.作为文化产业的重要载体和平台,“农家乐”等生态休闲旅游项目利于改变我国山区落后的经济状况。6项,“取决于该城市对本地历史文化、民间传统艺术等的挖掘利用程度”不正确,由第五段内容可知,切实保护历史文物古迹,深入挖掘、开发本地历史文化,只是彰显地域文化特色的有效途径。7善于抓住景物前面的修饰语及后面的动词、形容词,把握景物特征,从特征中捕捉背后的情感特征。8本诗构思别致,主客对答,情节性强,先总起写劝酒场面,接着两句是客人表白心怀,于是主人再次劝酒致辞,客人最后再作回应。9.古代以亲属关系的远近制定丧服的轻重。期,穿一周年孝服的人;功,穿七个月大功服、穿五个月小功服的亲族。“外无期功强近之亲”中的“期功”指关系比较近的亲属。,1.地域文化因历史悠久,富有人文内涵,在今天仍发挥重要作用,
链接地址:https://www.31ppt.com/p-1721566.html