教育统计学ppt课件 8 假设检验.ppt
心理与教育统计学,第七章假设检验,假设检验在统计方法中的地位,一、假设检验的基本思想和原理,什么是假设?(hypothesis),对总体参数的具体数值所作的陈述总体参数包括总体均值、比例、方差等分析之前必需陈述,什么是假设检验?(hypothesis test),先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的过程有参数检验和非参数检验逻辑上运用反证法,统计上依据小概率原理,假设检验的基本思想,. 因此我们拒绝假设 = 50,样本均值,m,= 50,抽样分布,H0,假设检验的过程,课本例5-1某校高中一年级试用一种新的教学法学习数学,根据实验结果知道,用原来的教学法,数学考试平均成绩为79分(记为m0),标准差为11分(记为s0 ),使用新的教学方法后,从中随机抽取参加试验的30人(记为n),计算得到他们的数学平均成绩为84分(记为 ),能否从总体上说新的教学法与原来的教学法存在差异或者说新的教学法优于原来的教学法?,H0 (原假设):新的教学法与原来的教学法不存在差异, m = m0,H1 (备择假设) :新的教学法与原来的教学法存在差异,m m0,原假设(null hypothesis),研究者想收集证据予以反对的假设又称“0假设”总是有符号 , 或表示为 H0H0 : = 某一数值 例如, H0 : 10cm,研究者想收集证据予以支持的假设也称“研究假设”总是有符号 , 或 表示为 H1H1 : 某一数值,或 某一数值例如, H1 : 10cm,或 10cm,备择假设(alternative hypothesis),一种零件的生产标准是直径应为10cm,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于10cm,则表明生产过程不正常,必须进行调整。试陈述用来检验生产过程是否正常的原假设和备择假设,提出假设,解:研究者想收集证据予以证明的假设应该是“生产过程不正常”。建立的原假设和备择假设为 H0 : 10cm H1 : 10cm,某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于500克。从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设,解:研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符合说明书中的陈述 。建立的原假设和备择假设为 H0 : 500 H1 : 500,500g,提出假设,一家研究机构估计,某城市中家庭拥有汽车的比例超过30%。为验证这一估计是否正确,该研究机构随机抽取了一个样本进行检验。试陈述用于检验的原假设与备择假设解:研究者想收集证据予以支持的假设是“该城市中家庭拥有汽车的比例超过30%”。建立的原假设和备择假设为 H0 : 30% H1 : 30%,提出假设,原假设和备择假设是一个完备事件组,而且相互对立在一项假设检验中,原假设和备择假设必有一个成立,而且只有一个成立先确定备择假设,再确定原假设 等号“=”总是放在原假设上 因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论),提出假设(结论与建议),课本例5-1某校高中一年级试用一种新的教学法学习数学,根据实验结果知道,用原来的教学法,数学考试平均成绩为79分(记为m0),标准差为11分(记为s0 ),使用新的教学方法后,从中随机抽取参加试验的30人(记为n),计算得到他们的数学平均成绩为84分(记为 ),能否从总体上说新的教学法与原来的教学法存在差异或者说新的教学法优于原来的教学法?,H0 (原假设):新的教学法与原来的教学法不存在差异, m = m0,m0,数学考试平均成绩为79分(记为m0)标准差为11分(记为s0 ),样本均值的抽样分布,假设检验中的小概率原理,什么小概率?1.小概率事件指的是在一次试验中,不可能发生的事件发生;2.在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设3.小概率由研究者事先确定, 为显著性水平0.05、0.01、0.001,m0,样本均值的抽样分布,样本均值的抽样分布,小概率事件指的是在一次试验中,不可能发生的事件发生;,显著性水平和拒绝域,接受H0,显著性水平和拒绝域,抽样分布,a越大,接受域区间就会较小; a越小,接受域区间就会较大。,显著性水平和拒绝域(双侧检验 ),显著性水平和拒绝域(双侧检验 ),显著性水平和拒绝域(双侧检验 ),课堂提问:,1. 什么叫0假设,其符号为,其表现形式为?2. 什么叫备择假设,其符号为,其表现形式为?3. 什么叫小概率事件,它在假设检验中有何规则?4. 请根据图形指出,哪些区域是零假设的拒绝域,哪些区域是零假设的接受域?5. 显著性水平取值越大,接受域区间就越大,反之,接受域区间就越小。这句话对吗?,假设检验中的两类错误,第类错误(弃真错误)原假设为真时拒绝原假设第类错误的概率记为被称为显著性水平第类错误(取伪错误)原假设为假时未拒绝原假设第类错误的概率记为(Beta),H0 为真时样本平均数的分布。,H1 为真时样本平均数的分布。,假设检验就好像一场审判过程,统计检验过程,假设检验中的两类错误, 错误和 错误的关系,影响 错误的因素,1.显著性水平 对于固定的n当 减少时增大,但 +12.总体标准差 当 增大时增大3.样本容量 n当 n 增大 、 减少4.真伪值的距离。距离越短 越大,犯类错误越大,统计功效和效果量,1.统计功效等于1-,即当零假设不为真时,拒绝零假设的概率。统计功效实际上反映了通过有效的实验处理发现存在的差异的概率,即检验的效率。其值越大越好。2.效果量(effect size)是实验处理的效应大小,或者自变量和因变量关系的大小。效果量反映了零假设不为真的程度。3.样本容量 n, 水平、效果量和统计功效这四者之间的关系是:其中任意一个都是其余三个的函数。在样本容量和 水平等情形都确定的情况下,效果量增加或减少,统计功效值也随之增加或减少,反之亦然。,统计功效和效果量,4.计算统计功效(1-)主要有两个功能:A. 对于一定的效果量和 水平,确定获得统计显著性所需要的样本容量;B. 评价已完成的研究或者实验,尤其是统计不显著的结论,通过统计功效的计算可得知是不是由于样本容量不足而未能达到统计显著性。,备择假设没有特定的方向性,并含有符号“”的假设检验,称为双侧检验或双尾检验(two-tailed test) 备择假设具有特定的方向性,并含有符号“”或“”,称为右侧检验,双侧检验与单侧检验,双侧检验与单侧检验,显著性水平和拒绝域(单侧检验 ),m0,临界值,a,样本统计量,拒绝H0,抽样分布,1 - ,置信水平,观察到的样本统计量,显著性水平和拒绝域(左侧检验 ),m0,临界值,a,样本统计量,拒绝H0,抽样分布,1 - ,置信水平,观察到的样本统计量,显著性水平和拒绝域(右侧检验 ),给定显著性水平,查表得出相应的临界值z或z/2, t或t/2将检验统计量的值与 水平的临界值进行比较作出决策双侧检验:统计量 临界值,拒绝H0左侧检验:统计量 临界值,拒绝H0,思考题:,绘图解释说明在样本容量和显著水平都不变的条件下,单侧检验犯 错误的概率比双侧检验要小。,什么是P 值?(P-value),在原假设为真的条件下,检验统计量的观察值大于或等于其计算值的概率双侧检验为分布中两侧面积的总和反映实际观测到的数据与原假设H0之间不一致的程度被称为观察到的(或实测的)显著性水平决策规则:若p值, 拒绝H0,左侧检验的P 值,右侧检验的P 值,双侧检验的P 值,m0,数学考试平均成绩为79分(记为m0)标准差为11分(记为s0 ),样本均值的抽样分布,假设检验步骤,1. 建立原假设和备择假设2. 从所研究的总体中抽出一个随机样本3. 在零假设成立的前提下,寻找和决定合适的统计量及其抽样分布,并计算出统计量的值。常用的抽样分布:标准化的正态分布、t分布、F分布;对应的检验方法:Z检验、t检验和F检验。4. 确定一个适当的显著性水平,并计算出其临界值,指定拒绝域5. 将统计量的值与临界值进行比较,作出决策统计量的值落在拒绝域,拒绝H0,否则不拒绝H0也可以直接利用P值作出决策,二、总体均值的显著性检验,一、总体服从正态分布,总体方差s2 已知设x1 , x2, xn 是来自正态总体N(m0, s2 )的样本容量为n的随机样本,则对均值是否等于已知值作出检验。此时的假设检验成为Z检验。1. 假设检验的两个假设:H0 : m = m0 (m0已知)H1 : m m02. 由于s2 已知,且样本来自于正态总体,则样本均数的抽样分布均值为m,方差为s2/n。由此,可计算统计量:,一、总体服从正态分布,总体方差s2 已知设x1 , x2, xn 是来自正态总体N(m0, s2 )的样本容量为n的随机样本,则对均值是否等于已知值作出检验。此时的假设检验成为Z检验。3. 对于选定的显著性水平a,查标准化的正态分布 表得到临界值Za/2 。 , 或4. 比较统计量Z与Za/2的值,若Z Za/2,则拒绝零假设H0 ;若Z Za/2,则接受零假设H0。,一、总体服从正态分布,总体方差s2 已知例5-4. 全市统一考试的数学平均分m0=62分,标准差s0 =10.2分,市内一所学校的90名学生在该次考试的平均成绩为68分,问该校成绩与全市平均成绩的差异是否显著(a=0.05)?解:(1)提出假设H0 : m = 62;H1 : m 62(2)计算统计量(3)由显著性水平a=0.05,查表得Za/2=1.96(4) Z=5.58 1.96,一、总体服从正态分布,总体方差s2 已知例5-5. 某高校参加同专业的统一考试,随机抽查64份问卷,由此求得平均成绩为69分,标准差为9.5分。已知该科全体考生成绩服从正态分布,且总平均分为65分,问该校考生的平均成绩是否高于全体考生的平均水平(a=0.05)?解:(1)提出假设H0 : m 65;H1 : m 65(2)计算统计量(3)由显著性水平a=0.05,查表得Za=1.64(4) Z=3.37 1.64,二、总体服从正态分布,总体方差s2 未知设x1 , x2, xn 是来自正态总体N(m0, s2 )的样本容量为n的随机样本,当方差未知时,可用其无偏估计量S2来代替。此时的假设检验成为t检验。1. 假设检验的两个假设:H0 : m = m0 (m0已知)H1 : m m02. 由于s2 未知,则先计算样本的方差S2,再计算统计量:,二、总体服从正态分布,总体方差s2 未知设x1 , x2, xn 是来自正态总体N(m0, s2 )的样本容量为n的随机样本,当方差未知时,可用其无偏估计量S2来代替。此时的假设检验成为t检验。3. 对于选定的显著性水平a,自抽取样本中计算得到的自由度df=n-1,查t分布表得到临界值ta/2(df) 。4. 比较统计量与临界值ta/2 ,若t ta/2 ,则拒绝零假设H0 ;若 t ta/2 ,则接受零假设H0。,二、总体服从正态分布,总体方差s2 未知例5-6. 学生的学习成绩与教师的教学方法有关。某校一教师采用了一种他认为是新式有效的教学方法。经过一年的教学后,从该教师所教班级中随机抽取了6名学生的考试成绩,分别为48.5,49.0,53.5,49.5,56.0,52.5,而在该学年考试中,全年级的总平均分数为52.0,试分析这种教学方法与未采用新教学方法的学生成绩有无显著性差异(考生成绩服从正态分布,取a=0.05)?解:计算样本均值为51.5,样本标准差S为2.98(1)提出假设H0 : m = 52;H1 : m 52(2)计算统计量(3)由显著性水平a=0.05,自由度df=6-1=5,查表得ta/2(5)=2.571(4) t=0.41 ta/2(5)=2.571,二、总体服从正态分布,总体方差s2 未知例5-7. 某省进行数学竞赛,发现分数分布不是正态分布。竞赛的总平均分是43.5分。某市参加竞赛的学生168人,平均分为45.1,S=18.7,问该市平均分与省平均分是否有显著差异(取a=0.05)?解:(1)提出假设H0 : m = 43.5;H1 : m 43.5(2)计算统计量(3)由显著性水平a=0.05,,查表得Za/2=1.96(4) Z=1.11Za/2=1.96,样本容量n,总体均值的显著性检验总结,大样本的总体均值显著性检验,注: 已知的拒绝域同大样本,小样本的总体均值显著性检验,1. 一种罐装饮料采用自动生产线生产,每罐的容量是255ml,标准差为5ml。为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了40罐进行检验,测得每罐平均容量为255.8ml。取显著性水平=0.05 ,检验该天生产的饮料容量是否符合标准要求?,H0 :0 = 1 =255H1 : 0 1 = 0.05n = 40临界值:Z /2=1.96,检验统计量:,决策:,结论:,|Z|=1.011.96,即接受原假设H0,样本提供的证据表明:该天生产的饮料符合标准要求,2. 一种机床加工的零件尺寸绝对平均误差允许值为1.35mm。生产厂家现采用一种新的机床进行加工以期进一步降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降低,从某天生产的零件中随机抽取50个进行检验。利用这些样本数据,检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低? (=0.01),H0 : 1 0=1.35H1 : 1 0 = 0.01n = 50临界值:Z =2.33,检验统计量:,|Z|=2.60612.33,即拒绝原假设H0,新机床加工的零件尺寸的平均误差与旧机床相比有显著降低,决策:,结论:,P 值的图示,3.某一小麦品种的平均产量为5200kg/hm2 。一家研究机构对小麦品种进行了改良以期提高产量。为检验改良后的新品种产量是否有显著提高,随机抽取了36个地块进行试种,得到的样本平均产量为5275kg/hm2,标准差为120/hm2 。试检验改良后的新品种产量是否有显著提高? (=0.05),H0 : 5200H1 : 5200 = 0.05n = 36临界值: Z =1.645,检验统计量:,|Z|=3.751.645,即拒绝原假设H0 (P = 0.000088 = 0.05),改良后的新品种产量有显著提高。,决策:,结论:,P 值的图示,4. 一种汽车配件的平均长度要求为12cm,高于或低于该标准均被认为是不合格的。汽车生产企业在购进配件时,通常是经过招标,然后对中标的配件提供商提供的样品进行检验,以决定是否购进。现对一个配件提供商提供的10个样本进行了检验。假定该供货商生产的配件长度服从正态分布,在0.05的显著性水平下,检验该供货商提供的配件是否符合要求?,H0 : = 12H1 : 12 = 0.05df = 10 - 1 = 9临界值:t /2=2.262,检验统计量:,|t|=0.70352.262即接受原假设H0,该供货商提供的零件符合要求。,决策:,结论:,三、两总体均值差异的显著性检验,一、两组样本相互独立,总体方差s12与s22已知设有两个服从正态分布的相互独立的总体X和Y,它们的均值分别为m1和m2 , 方差分别为s12与s22, x1 , x2, xn 和y1 , y2, yn是分别来自X和Y的两组独立的随机样本,我们要根据两组样本的信息,检验出两总体均值m1和m2差异是否显著的结论。方差的一个重要性质是:当两个变量独立时,其和或差的方差等于各自方差的和,即:sX+Y2= sX2 +sY2或sX-Y2= sX2 +sY2由抽样分布的理论可知,来自X的样本均数方差为s12/n1,来自Y的样本均数方差为s22/n2 ,因而 的方差为:,一、两组样本相互独立,总体方差s12与s22已知设有两个服从正态分布的相互独立的总体X和Y,它们的均值分别为m1和m2 , 方差分别为s12与s22, x1 , x2, xn 和y1 , y2, yn是分别来自X和Y的两组独立的随机样本,我们要根据两组样本的信息,检验出两总体均值m1和m2差异是否显著的结论。那么下面的统计量将服从标准正态分布,应用Z检验的步骤和方法,就可以得到假设检验的结果。,一、两组样本相互独立,总体方差s12与s22已知例5-8 在参加了全国统一考试后,已知考生某科成绩服从正态分布。在甲省抽取657名考生的成绩,得到平均分为57.41的分,且该省的总标准差为5.77分;在乙省抽取686名考生的成绩,得到平均分为55.95分,该省的总标准差为5.17分。问两省考生在该次考试中,平均分是否有显著差异(取a=0.01)?解:(1)提出假设:H0 : 1 = 2 ;H1 : 1 2 (2)计算统计量,一、两组样本相互独立,总体方差s12与s22已知例5-8 在参加了全国统一考试后,已知考生某科成绩服从正态分布。在甲省抽取657名考生的成绩,得到平均分为57.41的分,且该省的总标准差为5.77分;在乙省抽取686名考生的成绩,得到平均分为55.95分,该省的总标准差为5.17分。问两省考生在该次考试中,平均分是否有显著差异(取a=0.01)?解:(3)对给出的a=0.01, 查表得到临界值Z0.01/2=2.58(4)Z=4.88 Z0.01/2=2.58。,二、两组样本相互独立,总体方差未知,且s12=s22如果我们要检验零假设H0 : 1 = 2,而当总体方差相等即零假设成立的情况下,我们可以计算出两个样本平均数和两个样本方差。从抽样分布的理论可知,下面的统计量将服从自由度为df=n1+n2-2的t分布。,二、两组样本相互独立,总体方差未知,且s12=s22根据以上信息,我们就可以根据给定的显著性水平a以及计算得到的自由度df,查t分布表得到临界值ta/2(df) 。若t ta/2 ,则拒绝零假设H0 ;若 t ta/2 ,则接受零假设H0。例5-9. 某校进行一项智力速度测验,共有19名学生参加,其中男生12人,女生7人。测验共200题,在规定时间里,答对1题记1分。测验结束后,得到以下测验成绩:男生12人:83、146、119、104、120、161、107、134、115、129、99、123;女生7人:70、118、101、85、107、132、94;试确定男女生平均成绩有无显著差异( a =0.05),二、两组样本相互独立,总体方差未知,且s12=s22解:(1)检验假设: H0 : 1 = 2 ;H1 : 1 2 (2)计算统计量:平均成绩1=120,平均成绩2=101; s12=445.82, s22=425.33(3)给定的a =0.05,且df=12+7-2=17,查表ta/2(17)= 2.11,三、两组样本相互独立,总体方差未知,且s12s22如果方差不等,或者方差不齐性,如何比较两总体的平均数差异呢?在s12s22以及H0 : 1 = 2 成立的条件下,上述统计量t不再服从自由度df=n1+n2-2的t分布。在这种情况下,我们应该采用下面两种近似的检验方法。(1)Aspin-Welch检验。,三、两组样本相互独立,总体方差未知,且s12s22(1)Aspin-Welch检验。例5-10 为了对某门教学方法进行改革,某校对各方面情况相似的两个班进行教改实验,甲班45人,采用教师面授的教学方法;乙班36人,采用教师讲授要点,学生讨论的方法。一学年后,用同一试题对两个班的学生进行测验,得到以下结果:甲班平均分69.5分,标准差为8.35分;一般平均分78.0分,标准差为16.5分。试问两种教学方法其效果是否有显著性差异(a =0.01)解:(1)检验假设为:H0 : 1 = 2 ;H1 : 1 2 (2)计算检验统计量,三、两组样本相互独立,总体方差未知,且s12s22例5-10 为了对某门教学方法进行改革,某校对各方面情况相似的两个班进行教改实验,甲班45人,采用教师面授的教学方法;乙班36人,采用教师讲授要点,学生讨论的方法。一学年后,用同一试题对两个班的学生进行测验,得到以下结果:甲班平均分69.5分,标准差为8.35分;一般平均分78.0分,标准差为16.5分。试问两种教学方法其效果是否有显著性差异(a =0.01)解:,三、两组样本相互独立,总体方差未知,且s12s22例5-10 为了对某门教学方法进行改革,某校对各方面情况相似的两个班进行教改实验,甲班45人,采用教师面授的教学方法;乙班36人,采用教师讲授要点,学生讨论的方法。一学年后,用同一试题对两个班的学生进行测验,得到以下结果:甲班平均分69.5分,标准差为8.35分;一般平均分78.0分,标准差为16.5分。试问两种教学方法其效果是否有显著性差异(a =0.01)解:(3)计算df,求出临界值。,三、两组样本相互独立,总体方差未知,且s12s22如果方差不等,或者方差不齐性,如何比较两总体的平均数差异呢?在s12s22以及H0 : 1 = 2 成立的条件下,上述统计量t不再服从自由度df=n1+n2-2的t分布。在这种情况下,我们应该采用下面两种近似的检验方法。(2)Cochran-Cox检验。这种检验方法用ta/2(n1-1) 与ta/2(n2-1)的加权平均数计算某种a水平下的临界值。,三、两组样本相互独立,总体方差未知,且s12s22例5-10 为了对某门教学方法进行改革,某校对各方面情况相似的两个班进行教改实验,甲班45人,采用教师面授的教学方法;乙班36人,采用教师讲授要点,学生讨论的方法。一学年后,用同一试题对两个班的学生进行测验,得到以下结果:甲班平均分69.5分,标准差为8.35分;一般平均分78.0分,标准差为16.5分。试问两种教学方法其效果是否有显著性差异(a =0.01)解:(3)计算df,求出临界值。,2.694,2.724,三、两组样本相互独立,总体方差未知,且s12s22注:当n1和n2都是大样本时,t分布接近正态分布,此时可以不考虑两组方差是否相等,直接计算统计量在零假设: H0 : 1 = 2 成立的条件下,该统计量将接近服从标准正态分布。,三、两组样本相互独立,总体方差未知,且s12s22例5-12 为了比较独生子女和非独生子女在学习方面的差异,随机抽取独生子女135人,非独生子女98人,然后统一进行智力测验,结果独生子女平均成绩为60.6,标准差为6,非独生子女平均数为59.8,标准差为10.2,问独生子女与非独生子女在智力方面是否存在显著差异( a =0.05 )?解:(1)检验假设: H0 : 1 = 2 ;H1 : 1 2 (2)计算统计量:,三、两组样本相互独立,总体方差未知,且s12s22例5-12 为了比较独生子女和非独生子女在学习方面的差异,随机抽取独生子女135人,非独生子女98人,然后统一进行智力测验,结果独生子女平均成绩为60.6,标准差为6,非独生子女平均数为59.8,标准差为10.2,问独生子女与非独生子女在智力方面是否存在显著差异( a =0.05 )?解:(3)查出临界值: Z0.05/2=1.96,四、两组样本有相关,五、样本方差与总体方差的检验,六、两个总体方差比的检验,六、两个总体方差比的检验,