概率统计第七章.ppt
第七章 假设检验,7.1 假设检验的基本思想与概念7.2 正态总体参数假设检验7.3 其它分布参数的假设检验7.4 分布拟合检验,7.1 假设检验的基本思想与概念,7.1.1 假设检验问题,某产品出厂检验规定:次品率p不超过4%才能出厂.现从一万件产品中任意抽查12件发现1件次品,问该批产品能否出厂?若抽查结果发现3件次品,问能否出厂?,引例1,抽查12件发现1件按理不能出厂.,分析,直接算,求检验准则:抽取的12个产品中至少有几个次品则判断不合格?思路:假定p=4%,约定=0.01(小概率),记12件样品中的次品数为X,检验准则为一次试验中,“Xk”发生为小概率事件时,则不能出厂。,这不是小概率事件,则该批产品可以出厂.,解,这是 小概率事件,一般在一次试验中是不会发生的,现一次试验竟然发生,故认为该批产品次品率 p4%,该批产品不能出厂.,对总体 提出假设,要求利用样本观察值,对提供的信息作出接受(可出厂),还是接受(不准出厂)的判断.,(1)小概率原理:认为概率很小的事件在一次试验中实际上不会出现,并且小概率事件在一次试验中出现了,就被认为是不合理的.,(2)基本思想:先对总体的参数或分布函数的作出某种假设,然后找出一个在假设下发生可能性甚小的小概率事件.如果试验或抽样的结果使该小概率事件发生了,这与小概率原理相违背,表明原来的假设有问题,应拒绝这个假设.若该小概率事件在一次试验或抽样中并未出现,表明试验或抽样结果支持这个假设,则接受原来的假设.,统计检验的基本思想,需要根据实际问题的需要,对总体参数或分布函数的表达式做出某种假设(称为统计假设),再利用从总体中获得的样本信息来对所作假设的真伪做出判断或进行检验.,这种利用样本检验统计假设真伪的过程叫做统计检验(假设检验),7.1.2 假设检验的基本步骤,一、建立假设,在假设检验中,常把一个被检验的假设称为原假设,用 表示,通常将不应轻易加以否定的假设作为原假设。当 被拒绝时而接收的假设称为备择假设,用 表示,它们常常成对出现。,在引例1中,我们可建立如下两个假设:,二、选择检验统计量,由样本对原假设进行判断总是通过一个统计量完成的,该统计量称为检验统计量。找出在原假设 成立条件下,该统计量所服从的分布。,三、选择显著性水平,给出拒绝域形式,小概率原理中,关于“小概率”的值通常根据实际问题的要求而定,如取=0.1,0.05,0.01等,为检验的显著性水平(检验水平).,根据所要求的显著性水平,描写小概率事件的统计量的取值范围称为该原假设的拒绝域(否定域),一般用W表示;一般将 称为接受域。拒绝域的边界称为该假设检验的临界值.,/2,/2,接受域,P(|U|u1/2)=,拒绝域,拒绝域,u1/2,-u1/2,例 某厂生产的合金强度服从,其中 的设计值 为不低于110(Pa)。为保证质量,该 厂每天都要对生产情况做例行检查,以判断生 产是否正常进行,即该合金的平均强度不低于 110(Pa)。某天从生产中随机抽取25块合金,测得强度值为x1,x2,x25,其均值为(Pa),问当日生产是否正常?,提出假设:,若原假设正确,则,不应该小于110太多,故,比110小到一定程度是小概率事件.,可以确定一个临界值c 使得,因此,取,则,由,为检验的接受域,即区间(,108.648)为检验的拒绝域,四、作出判断,在有了明确的拒绝域后,根据样本观测值我们可以做出判断:,当 或 时,则拒绝 即接收;当 或 时,则接收,在例中,由于,因此拒绝原假设,即认为该日生产不正常。,由例可见,在给定的前提下,接受还是拒绝原假设完全取决于样本值,因此所作检验可能导致以下两类错误的产生:,第一类错误,拒真错误,第二类错误,受伪错误,正确,正确,假设检验的两类错误,犯第一类错误的概率通常记为,拒真概率 犯第二类错误的概率通常记为,受伪概率,/2,/2,增大样本容量n时,可以使和同时减小.,注意:,u/2,-u/2,原假设真:=0,备择假设真:0(0),当样本容量 一定时,小,就大,反之,小,就大.,在进行假设检验时,我们采取的原则是:控制犯第一类错误(即 事先给定且很小)的同时使犯第二类错误的概率达到最小.,关于原假设与备择假设的选取,H0与H1地位应平等,但在控制犯第一类错误的概率 的原则下,使得采取拒绝H0 的决策变得较慎重,即H0得到特别的保护.,因而,通常把有把握的、有经验的结论作为原假设,或者尽可能使后果严重的错误成为第一类错误.,犯第一类错误的概率 和犯第二类错误的概率 可以用同一个函数表示,即所谓的势函数。势函数是假设检验中最重要的概念之一,定义如下:,定义 设检验问题,的拒绝域为W,则样本观测值落在拒绝域内的概率称为该检验的势函数,记为,(7.1.3),势函数 是定义在参数空间 上的一个函数。犯两类错误的概率都是参数 的函数,并可由势函数算得,即:,对例,其拒绝域为,由(7.1.3)可以算出该检验的势函数,这个势函数是 的减函数,v,v,g,同时可得如下结论:,利用这个势函数容易写出犯两类错误的概率分别为,和,思考:吗?,当 减小时,c 也随之减小,必导致的增大;当 减小时,c 会增大,必导致 的增大;,说明:在样本量一定的条件下不可能找到一个使 和 都小的检验。,英国统计学家 Neyman 和 Pearson 提出水平为 的显著性检验的概念。,则称该检验是显著性水平为 的显著性检验,简称水平为 的检验。,定义 对检验问题,对,如果一个检验满足对任意的,,都有,求势函数例:见P334 NO.2,7.2 正态总体参数假设检验,参数假设检验常见的有三种基本形式,(1),(2),(3),当备择假设 在原假设 一侧时的检验称 为单侧检验;,当备择假设 分散在原假设 两侧时的检验 称为双侧检验。,2)确定检验统计量:,H0:=0(已知);H1:0(双侧检验),1)提出原假设和备择假设:,H0:=0;H1:0,3)对给定,由原假设成立时P(|u|u1/2)=得 拒绝条件为|u|u1/2,单个正态总体均值的检验,一、已知 时 的检验,设总体XN(,2),X1,X2,Xn 为一组样本,,/2,/2,接受域,P(|U|u1-/2)=,否定域,否定域,u1-/2,-u1-/2,双侧统计检验,U检验,该检验用 u 检验统计量,故称为u 检验。,2)对统计量:,1)提出原假设和备择假设:,H0:0;H1:0,3)故 拒绝条件为U u1-,对给定的有,在H0下有,所以,H0:0(已知);H1:0(右侧检验),接受域,否定域,u1-,单侧(右侧)统计检验,P(u1-),2)选择统计量:,1)提出原假设和备择假设:,H0:0;H1:0,3)对给定,否定域为U-u1-,H0:0(已知);H1:0(左侧检验),接受域,否定域,-u1-,单侧(左侧)统计检验,P(-u1-),由 可推出具体的拒绝域为,该检验的势函数是 的函数,它可用正态分布写出,具体为,对右侧检验,势函数是 的增函数(见图),只要 就可保证在 时有,7.2.1(a)的图形,对左侧检验 是类似,只是拒绝域变为:,其势函数为,对双侧检验问题(7.2.3),拒绝域为,其势函数为,7.2.1(b)(c)的图形,例 从甲地发送一个讯号到乙地。设乙地接 受到的讯号值服从正态分布 其中 为甲地发送的真实讯号值。现甲地重复发送同 一讯号5次,乙地接收到的讯号值为,8.05 8.15 8.2 8.1 8.25,设接受方有理由猜测甲地发送的讯号值为8,问能否接受这猜测?,解:这是一个假设检验的问题,总体X N(,0.22),检验假设:,这个双侧检验问题的拒绝域为,取置信水平=0.05,则查表知 u0.975=1.96。,用观测值可计算得,u 值未落入拒绝域内,故不能拒绝原假设,即接受原假设,可认为猜测成立。,二、未知时的t 检验,由于 未知,一个自然的想法是将()中未知的 替换成样本标准差s,这就形成t 检验统计量,(7.2.9),三种假设的检验拒绝域分别为,例 某厂生产的某种铝材的长度服从正态分 布,其均值设定为240厘米。现从该厂抽取5件 产品,测得其长度为(单位:厘米),239.7 239.6 239 240 239.2,试判断该厂此类铝材的长度是否满足设定要求?,解:这是一个关于正态均值的双侧假设检验问题。采用t 检验,拒绝域为:,现由样本计算得到:,由于2.79512.776,故拒绝原假设,认为该厂生产的铝材的长度不满足设定要求。,若取=0.05,则 t0.975(4)=2.776.,故,表7.2.1 单个正态总体的均值的检验问题,单正态总体均值假设检验的步骤第一,根据题意,提出原假设和备择假设;两者在逻辑上是对立的.第二,确定显著性水平,并计算出临界值;确定统计量的拒绝域和接受域,注意是单边还是双边检验;第三,确定适当的检验统计量,并计算其取值;(比如单总体均值检验中,当已知总体方差时,用U 统计量;总体方差未知时,用t 统计量)第四,将检验统计量的值与临界值进行比较,作出接受还是拒绝原假设的统计决策,三、假设检验与置信区间的关系,这里用的检验统计量与节中置信区间所用的枢轴量是相似的。这不是偶然的,两者之间存在非常密切的关系。,设 是来自正态总体 的样本,现在 未知场合讨论关于均值 的检验问题。考虑双侧检验问题:,它可以改写为,并且有,若让0 在(-)内取值,就可得到 的1-置信区间:,这里0并无限制.,则水平为的检验接受域为,关于 的水平为 的显著性检验。,是一一对应的。,类似地,“参数 的1-置信上限”与“关于,的单侧检验问题的水平 的检验”,反之若有一个如上的1-置信区间,也可获得,所以:“正态均值 的1-置信区间”与“关于 的双侧检验问题的水平 的检验”,参数 的1-置信下限与另一个单侧检验也是一一对应的。,是一一对应的。,假设检验与置信区间对照,7.2.2 两个正态总体均值差的检验,例 某厂铸造车间为提高铸件的耐磨性而 试制了一种镍合金铸件以取代铜合金铸件,为此,从两种铸件中各抽取一个容量分别为 8和9的样本,测得其硬度为,镍合金:76.43 76.21 73.58 69.69 65.29 70.83 82.75 72.34,铜合金:73.66 64.27 69.34 71.37 69.77 68.12 67.27 68.07 62.61,根据经验,硬度服从正态分布,且方差保持不变。试在显著性水平下判断镍合金的硬度是否有明显提高。,解:用X 表示镍合金的硬度,Y 表示铜合金的硬 度,则由假定,,要检验的假设是:,经计算,,从而,查表知,由于,故拒绝原假设,可判断镍合金硬度有显著提高。,正态总体方差的检验,一、单个正态总体方差的检验,设 是来自 的样本,对方差亦可考虑如下三个检验问题:,通常假定 未知,它们采用的检验统计量是,相同的,均为 若取显著性水平为,则对应三个检验问题的拒绝域依次分别为,例 某类钢板每块的重量X 服从正态分布,其一项质量指标是钢板重量的方差不得超过 0.016(kg2)。现从某天生产的钢板中随机抽取 25块,得其样本方差S2=0.025(kg2),问该天生 产的钢板重量的方差是否满足要求。,解:原假设为,备择假设为,此处n=25,若取=0.05,则查表知,由此,在显著性水平0.05下,我们拒绝原假设,认为该天生产的钢板重量不符合要求。,现计算可得,二、两个正态总体方差比的F 检验,设 是来自 的样本,是来自 的样本。考虑如下三个假设检验问题,通常,均未知,记,分别是由算得的 的无偏估计和由 算得的 的无偏估计.,可建立检验统计量:,三种检验问题对应的拒绝域依次为,例 甲、乙两台机床加工某种零件,零件 的直径服从正态分布,总体方差反映了加工 精度,为比较两台机床的加工精度有无差别,现从各自加工的零件中分别抽取7件产品和8 件产品,测得其直径为,这就形成了一个双侧假设检验问题,原假设是 备择假设为 此处 m=7,n=8,经计算,查表知,于是,若取=0.05,,其拒绝域为,由此可见,样本未落入拒绝域,即在0.05水平下可以认为两台机床的加工精度一致。,问 题,母亲嗜酒是否影响下一代的健康,美国的Jones医生于1974年观察了母亲在妊娠时曾患慢性酒精中毒的6名七岁儿童(称为甲组).以母亲的年龄,文化程度及婚姻状况与前6名儿童的母亲相同或相近,但不饮酒的46名七岁儿童为对照租(称为乙组).测定两组儿童的智商,结果如下:,由此结果推断母亲嗜酒是否影响下一代的智力?若有影响,推断其影响程度有多大?,提示,前一问题属假设检验问题 后一问题属区间估计问题,智商一般受诸多因素的影响.从而可以,本问题实际是检验甲组总体的均值是否比乙组总体的均值偏小?,若是,这个差异范围有多大?前一问题属假设检验,后一问题属区间估计.,解,假定两组儿童的智商服从正态分布.,由于两个总体的方差未知,而甲组的样本容量较小,因此采用大样本下两总体均值比较的U检验法似乎不妥.故,当 为真时,统计量,采用方差相等(但未知)时,两正态总体均值比较的 t 检验法对第一个问题作出回答.,为此,利用样本先检验两总体方差是否相等,即检验假设,拒绝域为,F 的观察值,未落在拒绝域内,故接受.即可认为,两总体方差相等.下面用 t 检验法检,验 是否比 显著偏小?即检验假设,当 为真时,检验统计量,其中,嗜酒会对儿童智力发育产生不良影响.,落在拒绝域内,故拒绝.即认为母亲,下面继续考察这种不良影响的程度.为此要对两总体均值差进行区间估计.,取,于是置信度为 99%的置信区间为,由此可断言:在99%的置信度下,嗜酒,母亲所生孩子在七岁时的智商比不饮酒,的母亲所生孩子在七岁时的智商平均要,低 2.09 到 39.91.,故限制显著性水平的原则体现了“保护原假设”的原则.,注,大家是否注意到,在解决问题时,两次假设检验所取的显著性水平不同.,前者远,在检验方差相等时,取;在,检验均值是否相等时取.,比后者大.为何这样取呢?因为检验的结果与检验的显著性水平 有关.,小,则拒绝域也会小,产生的后果使原假设难以被拒绝.,在 较大时,若能接受,说明为真的依据很充足;同样,在 很小时,我们仍然拒绝.说明 不真的理由就更充足.,说明在所给数据下,得出相应的,本例中,对,得出,可被接受,及对,可被拒绝,的结论.,结论有很充足的理由.,另外在区间估计中,取较小的显著,若反之,取较小的置信水平,则可,水平(即较大的置信水平),从而使,得区间估计的范围较大.,减少估计区间的长度,使区间估计精确,提高,但相应地区间估计的可靠度降低,了,即要冒更大的风险.,