第八章假设检验 第1讲ppt课件.ppt
1,概率论与数理统计,福建师范大学福清分校数计系,2,第八章 假设检验,第1讲,3,假设检验的基本概念,若对参数有所了解,但有怀疑猜测需要证实之时,用假设检验的方法来 处理,4,假设检验是指施加于一个或多个总体的概率分布或参数的假设. 所作假设可以是正确的,也可以是错误的.,为判断所作的假设是否正确, 从总体中抽取样本,根据样本的取值,按一定原则进行检验, 然后作出接受或拒绝所作假设的决定.,5,假设检验所以可行,其理论背景为实际推断原理,即“小概率原理”,6,引例,某产品出厂检验规定: 次品率p不超过4%才能出厂. 现从一万件产品中任意抽查12件发现3件次品, 问该批产品能否出厂?若抽查结果发现1件次品, 问能否出厂?,解 假设,这是 小概率事件 , 一般在一次试验中是不会发生的, 现一次试验竟然发生, 故认为原假设不成立, 即该批产品次品率 , 则该批产品不能出厂.,7,这不是小概率事件,没理由拒绝原假设,从而接受原假设, 即该批产品可以出厂.,若不用假设检验, 按理不能出厂.,注1,直接算,注2,本检验方法是 概率意义下的反证法,故拒绝原假设是有说服力的, 而接受原假设是没有说服力的. 因此应把希望否定的假设作为原假设.,8,对总体 提出假设,要求利用样本观察值,对提供的信息作出接受 (可出厂) , 还是接受 (不准出厂) 的判断.,9,1 假设检验,10,统计推断的另一类重要问题是假设检验问题. 在总体的分布函数完全未知或只知其形式, 但不知道参数的情况, 为了推断总体的某些未知特性, 提出某些关于总体的假设. 例如, 提出总体服从泊松分布的假设, 又如, 对正态总体提出数学期望等于m0的假设等. 我们是要根据样本对所提出的假设作出是接受, 还是拒绝的决策. 假设检验是作出这一决策的过程.,11,例1 某车间用一台包装机包装葡萄糖. 包得的袋装糖重是一个随机变量, 它服从正态分布. 当机器正常时, 其均值为0.5公斤, 标准差为0.015公斤. 某日开工后为检验包装机是否正常, 随机地抽取它所包装的糖9袋, 称得净重为(公斤):0.497, 0.506, 0.518, 0.524, 0.498, 0.511, 0.520, 0.515, 0.512问机器是否正常?,12,以m,s分别表示这一天袋装糖重总体X的均值和标准差. 由于长期实践表明标准差比较稳定, 就设s=0.015. 于是XN(m,0.0152), 这里m未知. 问题是根据样本值来判断m=0.5还是m0.5. 为此, 我们提出两个相互对立的假设H0:m=m0=0.5和H1:m0.5.然后给一个合理的法则, 利用已知样本作出是接受假设H0, 还是接受假设H1. 如果接受H0, 则认为机器工作正常,否则不正常.,13,由于要检验的假设涉及总体均值m, 故首先想到是否可借助样本均值X这一统计量来进行判断. X是m的无偏估计, 其观察值的大小在一定程度上反映m的大小. 如果假设H0为真, 则观察值x与m0的偏差|x-m0|一般不应太大. 若|x-m|过分大, 就怀疑假设H0的正确性而拒,14,因此, 可适当选定一正数k,使当观察值x满足,然而, 因为决策的依据是样本, 当实际上H0为真时仍可能做出拒绝H0的决策(这种可能性是无法消除的), 这是一种错误, 犯这种错误的概率记为,15,因无法排除犯这类错误的可能性, 因此自然希望将犯这类错误的概率控制在一定的限度之类. 即给出一个较小的数a(0a1), 使犯这类错误的概率不超过a, 即使得P当H0为真拒绝H0a.(1.1),犯这类错误的概率最大为a, 令(1.1)式取等号,16,态分布分位点的定义得: k=za/2.,17,因而, 若Z的观察值满足,则拒绝H0, 而若,则接受H0,18,例如, 在本例中取a=0.05, 则有k=z0.05/2=z0.025=1.96, 又已知n=9, s=0.015, 再由样本算得x=0.511, 即有,于是拒绝H0, 认为这天包装机工作不正常.,19,上例中所采用的检验法则是符合实际推断原理的. 因通常a总是取得较小, 一般取a=0.01, 0.05. 因而若H0为真, 即当m=m0时,断原理, 就可以认为, 如果H0为真, 则由一次试验得到的观察值x, 满足不等式,了, 则我们有理由怀疑H0为假, 拒绝H0.,20,上例中, 当样本容量固定时, 选定a后, 可确定,绝对值|z|大于等于k还是小于k来作出决策. 数k是检验上述假设的一个门槛值. 如果|z|k, 则称x与m0的差异是显著的, 这时拒绝H0; 反之, 如果|z|k, 则称x与m0的差异是不显著的, 这时接受H0. 数a称为显著性水平, 上面关于x与m0有无显著差异的判断是在显著性水平a之下作出的. 统计量Z称为检验统计量.,21,前面的检验问题常叙述成: 在显著性水平a下, 检验假设H0:m=m0, H1:mm0. (1.2)也常说成在显著性水平a下, 针对H1, 检验H0. H0称为原假设或零假设, H1称为备择假设. 要进行的工作是, 根据样本, 按上述检验方法作出决策, 在H0与H1中择其一.当检验统计量取某个区域C中的值时, 我们拒绝原假设H0, 则C称为拒绝域, 拒绝域的边界点称为临界点, 如上例中拒绝域为|z|za/2, 而z=-za/2, z=za/2为临界点.,22,由于检验法则是根据样本作出的, 总有可能作出错误的决策. 如上面所说, 在假设H0实际上为真时, 可能犯拒绝H0的错误, 称这类弃真错误为第I类错误. 又当H0实际上不真时, 也有可能接受H0. 称这类取伪错误为第II类错误. 犯第II类错误的概率记为,23,一般来说, 当样本容量固定时, 若减少犯一类错误的概率, 则犯有另一类错误的概率往往增大. 一般来说, 总是控制第I类错误的概率, 使它不大于a, a的大小视具体情况而定, 通常a取0.1, 0.05, 0.01, 0.005等值. 这种只对犯第I类错误的概率加以控制, 而不考虑犯第II类错误的概率的检验, 称为显著性检验.形如(1.2)式中的备择假设H1, 表示m1可能大于也可能小于m0, 称为双边备择假设, 而称形如(1.2)式的假设检验为双边假设检验.,24,有时只关心总体均值是否增大. 例如试验新工艺以提高材料的强度. 这时, 所考虑的总体的均值应该越大越好. 此时, 我们需要检验假设H0:mm0, H1:mm0. (1.3)形如(1.3)的假设检验, 称为右边检验. 类似地, 有时需要检验假设H0:mm0,H1:mm0.(1.4)形如(1.4)的假设检验, 称为左边检验. 右边检验和左边检验统称为单边检验.,25,下面讨论单边检验的拒绝域.设总体XN(m,s2), s为已知, X1,X2,.,Xn是来自X的样本. 给定显著性水平a. 来求检验问题H0:mm0, H1:mm0(1.3)的拒绝域.因H0中的全部m都比H1中的m要小, 当H1为真时, 观察值x往往偏大, 因此, 拒绝域的形式为xk(k是某一正常数).,26,下面来确定常数k,令,27,28,29,类似地, 可得左边检验问题H0:mm0, H1:mm0(1.4)的拒绝域为,30,例2 公司从生产商购买牛奶.公司怀疑生产商在牛奶中掺水以谋利.通过测定牛奶冰点,可以检验出牛奶是否掺水.天然牛奶的冰点温度近似服从正态分布,均值1= -0.545 oC,标准差=0.008 oC.牛奶掺水可使冰点温度升高而接近于水的冰点温度(0 oC).测得生产商提交的5批牛奶的冰点温度,其均值为 =-0.535 oC ,问是否可以认为生产商在牛奶中掺了水?取0.05,31,32,例3 某工厂生产的固体燃料推进器的燃烧率服从正态分布N(m,s2), m=40cm/s, s=2cm/s. 现在用新方法生产了一批推进器. 从中随机取n=25只, 测得燃烧率的样本均值为x=41.25cm/s. 设在新方法下总体均方差仍为2cm/s, 问用新方法生产的推进器的燃烧率是否较以往生产的推进器的燃烧率有显著的提高? 取显著性水平a=0.05.,33,解 按题意需检验假设H0:mm0=40 (假设新方法没有提高燃烧率),H1:mm0 (假设新方法提高了燃烧率).这是右边检验问题, 其拒绝域如(1.6)式所示,z的值落在拒绝域中,所以在显著性水平a=0.05下拒绝H0, 认为新法的燃烧率有显著提高.,34,综上所述, 处理参数的假设检验问题步骤为:1. 根据实际问题的要求, 提出原假设H0及备择假设H1;2. 给定显著性水平a以及样本容量n;3. 确定检验统计量以及拒绝域的形式;4. 按P当H0为真拒绝H0a求出拒绝域;5. 取样, 根据样本观察值作出决策, 是接受H0还是拒绝H0.,35,2 正态总体均值的假设检验,36,(一) 单个总体N(m,s2)均值m的检验1, s2已知, 关于m的检验(Z检验)在1中已讨论过正态总体N(m,s2)当s2已知时关于m的检验问题(1.2),(1.3),(1.4). 在这些检验问题中, 我们都是利用统计量,这种检验法常称为Z检验法.,37, 0, 0, 0, 0, 0, 0,Z检验法 (2 已知),38,2, s2未知, 关于m的检验(t检验)设总体XN(m,s2), 其中m,s2未知, 我们来求检验问题H0:m=m0,H1:mm0的拒绝域(显著性水平为a).设X1,X2,.,Xn是来自总体X的样本, 由于s2未,到S2是s2的无偏估计, 我们用S来代替s, 采用,39,域的形式为,而当H0为真时,40,故由,得k=ta/2(n-1), 即得拒绝域为,对于正态总体N(m,s2), 当s2未知关于m的单边检验的拒绝域在书上表8.1中给出.上述利用 t 统计量的检验法称为t 检验法,41, 0, 0, 0, 0, 0, 0,T 检验法 (2 未知),42,例 某厂生产小型马达,说明书上写着:在正常负载下平均消耗电流不超过0.8 安培.,解 根据题意待检假设可设为,随机测试16台马达, 平均消耗电流为0.92安培,标准差为0.32安培.,设马达所消耗的电流 服从正态分布, 取显著性水平为 = 0.05, 问根据此样本, 能否否定厂方的断言?,43,H0 : 0.8 ; H1 : 0.8, 未知, 选检验统计量:,代入得,故接受原假设 H0 , 即不能否定厂方断言., :,拒绝域为,落在拒绝域 外,将,44,解二 H0 : 0.8 ; H1 : 0.8,选用统计量,拒绝域,故接受原假设, 即否定厂方断言.,现,落在拒绝域 外, :,45,由上例可见: 对问题的提法不同(把哪个假设作为原假设),统计检验的结果也会不同.,上述两种解法的立场不同,因此得到不同的结论.,第一种假设是不轻易否定厂方的结论;,第二种假设是不轻易相信厂方的结论.,46,为何用假设检验处理同一问题会得到截然相反的结果?,这里固然有把哪个假设作为原假设从而引起检验结果不同这一原因;除此外还有一个根本的原因,即样本容量不够大,若样本容量足够大,则不论把哪个假设作为原假设所得检验结果基本上应该是一样的否则假设检验便无意义了!,47,由于假设检验是控制犯第一类错误的概率, 使得拒绝原假设 H0 的决策变得比较慎重, 也就是 H0 得到特别的保护. 因而, 通常把有把握的, 经验的结论作为原假设, 或者尽量使后果严重的错误成为第一类错误.,48,例1 某种元件的寿命X(以小时计)服从正态分布N(m,s2), m, s2均未知. 现测得16只元件的寿命如下:159, 280, 101, 212, 224, 379, 179, 264222, 362, 168, 250, 149, 260, 485, 170问是否有理由认为元件的平均寿命大于225小时?,49,解 按题意需检验H0:mm0=225, H1:m225.取a=0.05. 由表8.1知此检验问题的拒绝域为,现在n=16, t0.05(15)=1.7531. 又算得x=241.5, s=98.7259, 即有,t没有落在拒绝域中, 故接受H0, 认为元件寿命不大于225小时.,50,(二)两个正态总体均值差的检验(t检验),设两样本独立. 又分别记它们的样本均值为X, Y, 记样本方差为S12, S22. 设m1,m2,s2均为未知, 要特别注意二总体方差相等. 求检验问题:H0:m1-m2=d, H1:m1-m2d(d为已知常数)的拒绝域. 取显著性水平为a.,51,引用下述t统计量作为检验统计量:,当H0为真时, 由第六章定理四知tt(n1+n2-2),52,与单个总体的t检验法相仿, 其拒绝域的形式为,由 P当H0为真拒绝H0=,可得k=ta/2(n1+n2-2).,53,于是得拒绝域为,而两个单边检验的问题的拒绝域在表8.1中给出, 常用的是d=0的情况.当两个正态总体的方差均为已知(不一定相等)时, 我们可用Z检验法来检验两正态总体均值差的假设问题, 也见表8.1.,54,1 2 = ,( 12,22 已知),(1) 关于均值差 1 2 的检验,1 2 ,1 2 ,1 2 ,1 2 ,1 2 ,55,1 2 = ,1 2 ,1 2 ,1 2 ,1 2 ,1 2 ,其中,56,例2 在平炉上进行一项试验以确定新方法是否比标准方法增加钢的得率. 用标准方法和新方法各炼10炉钢, 其得率为(1) 标准方法 78.1, 72.4, 76.2, 74.3, 77.4, 78.4, 76.0, 75.5, 76.7, 77.3(2) 新方法 79.1, 81.0, 77.3, 79.1, 80.0, 79.1, 79.1, 77.3, 80.2, 82.1设这两个样本相互独立, 且分别来自正态总体N(m1,s2), N(m2,s2), m1,m2,s2均未知. 问建议的新操作方法能否提高得到率?(取a=0.05.),57,解 需要检验假设H0:m1-m20, H1:m1-m20.分别求出标准方法和新方法下的样本均值和样本方差如下:n1=10,x=76.23, s12=3.325. n2=10, y=79.43, s22=2.225. sw2=2.775, t0.05(18)=1.7341,故拒绝域为,而现t =-4.295-1.7341, 所以拒绝H0, 即认为新方法比原方法优.,58,(三)基于成对数据的检验(t检验)有时为了比较两种产品, 或两种仪器, 两种方法等的差异, 常在相同的条件下作对比试验,得到一批成对的观察值. 然后分析观察数据作出推断. 这种方法常称为逐对比较法.,59,例3 有两台光谱仪Ix,Iy, 用来测量材料中某种金属的含量, 为鉴定它们的测量结果有无显著的差异, 制备了9件试块(成份, 金属含量, 均匀性等均各不相同, 现在分别用这两台仪器对每一试块测量一次, 得到9对观察值如下:,问能否认为这两台仪器的测量结果有显著差异(取a=0.01)?,60,解 本题中的数据是成对的, 而对于同一试块测出一对数据. 由于各试块的特性有广泛的差异, 不能将仪器Ix对9个试块的测量结果看成是同分布随机变量的观察值. 即不能将表的第一行和第二行的数据看作是一个样本的样本值. 但是这两行数据之差可以认为是由这两个仪器的性能之差引起的, 因此可以将第3行看作是来自于一个正态总体的样本.,61,一般, 设有n对相互独立的观察结果:(X1,Y1), (X2,Y2), ., (Xn,Yn), 令D1=X1-Y1, D2=X2-Y2, ., Dn=Xn-Yn, 则D1,D2,.,Dn相互独立, 并可认为它们来自同一总体, 假设DiN(mD, sD2), i=1,2,.,n, 其中mD, sD2未知. 我们需要基于这一样本假设:(1)H0:mD=0, H1:mD0;(2)H0:mD0, H1:mD0;(3)H0:mD0, H1:mD0.,62,分别记D1,D2,.,Dn的样本均值和样本方差的观察值为d, sD2, 按表8.1中单个正态总体均值的 t 检验. 知检验问题(1),(2),(3),的拒绝域分别为(检验水平为a):,63,现考虑本例问题, 将每一对数据之差算出. 按题意需检验假设H0:mD=0, H1:mD0.现在n=9, ta/2(8)=t0.005(8)=3.3554即知拒绝域为,由观察值得d=0.06, sD=0.1227, |t|=1.4673.3554. 现|t|的值不落在拒绝域内, 故接受H0, 认为两台仪器的测量结果并无显著差异.,64,3 正态总体方差的假设检验,65,(一)单个总体的情况设总体XN(m,s2), m,s2均未知, X1,X2,.,Xn是来自X的样本. 要求检验假设(显著性水平为a):H0:s2=s02, H1:s2s02,s02为已知常数.由于S2是s2的无偏估计, 当H0为真时, 观察值,不应过分大于1或过分小于1, 由第六章的定理知, 当H0为真时,66,则取,作为检验统计量, 如上知拒绝域有如下形式:,67,为计算方便起见, 习惯上取,68,下面讨论单边检验问题(显著性水平为a)H0:2s02, H1:2s02 (3.2)拒绝域的形式为 s2k.下面确定常数k.,69,要控制P当H0为真拒绝H0a, 只需令,70,类似地, 可得左边检验问题H0:s2s02, H1:s2s02的拒绝域为,以上检验法称为c2检验法.,71, 2 02, 2 02, 2 02, 2 02, 2=02, 2 02,检验法,( 已知),(2)关于 2 的检验,72, 2 02, 2 02, 2 02, 2 02, 2= 02, 2 02,( 未知),73,例1 某厂生产的某种型号的电池, 其寿命(以小时计)长期以来服从方差s2=5000的正态分布, 现有一批这种电池, 从它的生产情况来看, 寿命的波动性有所改变. 现随机取26只电池, 测出其寿命的样本方差s2=9200. 问根据这一数据能否推断这批电池的寿命的波动性较以往的有显著的变化(取a=0.02)?,74,解 本题要求在水平a=0.02下检验假设H0:s2=5000, H1:s25000.,所以拒绝H0, 认为寿命波动有显著变化.,75,(二) 两个总体的情况,76,77,常数k确定如下:,要控制P当H0为真拒绝H0a, 只需令,78,因此k=Fa(n1-1,n2-1), 即拒绝域为,上述检验法称为F检验法, 关于s12,s22的另外两个检验问题的拒绝域在表8.1中给出,79, 12 = 22, 12 22, 12 22, 12 22, 12 22, 12 22,(2) 关于方差比 12 / 22 的检验,80,例2 试对2例2中的数据检验假设(取a=0.01)H0:s12=s22, H1:s12s22.解 此处n1=n2=10, a=0.01F0.005(9,9)=6.54, F1-0.005(9,9)=0.153.拒绝域为,现算得s12=3.325, s22=2.225, s12/s22=1.49, 即0.153s12/s226.54(没有落入拒绝域)故接受H0, 认为两总体方差相等. 两总体方差相等也称两总体具有方差齐性.,81,置信区间与假设检验之间的关系,82,83,置信区间与假设检验之间有明显的联系, 先考察置信区间与双边检验之间的对应关系. 设X1,.,Xn是一个来自总体的样本, x1,.,xn是相应的样本值. Q是参数q的可能取值范围.,设(q(X1,.,Xn), q(X1,.,Xn)是参数q的一个置信水平为1-a的置信区间, 则对于任意qQ, 有 Pqq(X1,.,Xn) q q(X1,.,Xn)1-a, (4.1),考虑显著性水平为a的双边检验H0:q=q0, H1:qq0.(4.2),84,Pqq(X1,.,Xn) q q(X1,.,Xn)1-a, (4.1)H0:q=q0, H1:qq0.(4.2)由(4.1), 当H0为真时,按显著性水平为a的假设检验的拒绝域的定义, 检验(4.2)的拒绝域为 q0 q(x1,.,xn) 或 q0 q(x1,.,xn);接受域为q(x1,.,xn) q0 q(x1,.,xn).,85,这就是说, 当我们要检验假设(4.2)时, 先求出q的置信水平为1-a的置信区间(q,q), 然后考察q0是否落在区间(q,q), 若q0(q,q), 则接受H0, 若q0(q,q), 则拒绝H0.,86,反之, 对于任意q0Q, 考虑显著性水平为a的假设检验问题: H0:q=q0, H1:qq0,假设它的接受域为 q(x1,.,xn) q0 q(x1,.,xn),即有,由q0的任意性, 由上式知对于任意qQ, 有,因此(q(X1,.,Xn),q(X1,.,Xn)是参数q的一个置信水平为1-a的置信区间.,87,这就是说, 为要求出参数q的置信水平为1-a的置信区间, 我们先求出显著性水平为a的假设检验问题: H0:q=q0, H1:qq0的接受域:,q(x1,.,xn) q0 q(x1,.,xn),那么(q(X1,.,Xn),q(X1,.,Xn)就是q的置信水平为1-a的置信区间.,88,还可验证, 置信水平为1-a的单侧置信区间(-,q(X1,.,Xn)与显著性水平为a的左边检验问题H0:qq0, H1:qq0有类似的对应关系.,即若已求得单侧置信区间(-,q(X1,.,Xn), 则当q0(-,q(X1,.,Xn)时接受H0, 当q0(-,q(X1,.,Xn)时拒绝H0.,反之, 若已求得检验问题H0:qq0, H1:qq0的接收域为:- q0 q(X1,.,Xn), 则可得q的一个单侧置信区间(-,q(X1,.,Xn).,89,置信水平为1-a单侧置信区间(q(X1,.,Xn),)与显著性水平为a的右边检验问题H0:qq0, H1:qq0也有类似的对应关系.,即若已求得单侧置信区间(q(X1,.,Xn),). 则当q0 (q(X1,.,Xn),)时接受H0, 当q0 (q(X1,.,Xn),)时拒绝H0.,反之, 若已求得检验问题H0:qq0, H1:qq0的接受域为:q(X1,.,Xn)q0, 则可得q的一个置信区间:(q(X1,.,Xn),).,90,假设检验与置信区间对照,( 2 已知),( 2 已知),91,( 2未知),( 2未知),92,(未知),(未知),93,例1 设XN(m,1), m未知, a=0.05, n=16, 且由一样本算得x=5.20, 于是得到参数m的一个置信水平为0.95的置信区间,现在考虑检验问题H0:m=5.5, H1:m5.5. 由于5.5(4.71, 5.69), 故接受H0.,94,例2 数据如上例. 试求右边检验问题H0:mm0, H1:mm0的接受域, 并求m的单侧置信下限(a=0.05).解 检验问题的拒绝域为,或即m04.79. 于是检验问题的接受域为m04.79. 这样就得到m的单侧置信区间(4.79, ), 单侧置信下限m=4.79.,95,作业 第八章习题,第232页第1, 2,14题,96,1假设检验的依据是什么?,答:假设检验的依据是“实际推断原理”,即“小概率事件在一次试验中几乎不可能发生”。,97,2假设检验可能产生的两类错误是什么?,第一类错误: 为真但拒绝了,称此类错误为“弃真”;(称为显著性检验问题)第二类错误:为假但接受了,称此类错误为“取伪”。,98,3假设检验的一般步骤是什么?,假设检验的一般步骤是 根据给定问题提出原假设和备择假设; 选取适当的统计量,并在原假设成立的条件下确定其分布; 给定显著性水平,确定检验的拒绝域和接受域; 根据样本观察值计算统计量的观察值; 做出判断。,99,请提问,