《假设检验完全》PPT课件.ppt
《《假设检验完全》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《假设检验完全》PPT课件.ppt(125页珍藏版)》请在三一办公上搜索。
1、假设检验,假设检验是在两种互相对立的行动之间,通过对样本的试验,在一定的保证条件下进行决策的统计分析方法。,假设检验在统计方法中的地位,例子:,1.康涅狄格州高速公路巡警对超速驾驶者实施严厉制裁后高速公路交通事故死亡人数下降。怀俄明州杰克逊谷地公共卫生工程队的垃圾处理量是平均每周247吨。传统上,假设检验都是以否定句的形式表示。以否定句的形式表述的假设为原假设(假设什么也未发生),(一)假设检验的意义和程序1.设立假设。2.作检验统计量。3.确定显著性水平及相应的t值。4.确定拒绝域。5.作出决策。(二)假设检验的内容1.双侧检验2.单侧检验,(一)假设检验的意义假设检验是抽样推断中的一项重要
2、内容。它是根据原资料作出一个总体指标是否等于某一个数值,某一随机变量是否服从某种概率分布的假设,然后利用样本资料采用一定的统计方法计算出有关检验的统计量,依据一定的概率原则,以较小的风险来判断估计数值与总体数值(或者估计分布与实际分布)是否存在显著差异,是否应当接受原假设选择的一种检验方法。,(二)假设检验的步骤,1.问题的提出:对问题详加调查研究之后,根据试验或观察数据来选择一个适宜的概率模型2.假设的设立:陈述假设,即提出一个零假设和一个备择假设3.确定检验统计量:识别被检验的统计量及其分布4.确定显著性水平5.作出判断:计算被检验的实际统计量之值,用实际统计量之值与临界值比较,以确定接受
3、或拒绝,1.什么是假设检验,假设检验是推论统计的重要内容,是先对总体的未知数量特征作出某种假设,然后抽取样本,利用样本信息对假设的正确性进行判断的过程。,统计假设有参数假设、总体分布假设、相互关系假设(两个变量是否独立,两个分布是否相同)等。参数假设是对总体参数的一种看法。总体参数包括总体均值、总体比例、总体方差等。分析之前必需陈述。,我认为该企业生产的零件的平均长度为4厘米!,参数假设检验,参数假设检验是通过样本信息对关于总体参数的某种假设合理与否进行检验的过程。即先对未知的总体参数的取值提出某种假设,然后抽取样本,利用样本信息去检验这个假设是否成立。如果成立就接受这个假设,如果不成立就放弃
4、这个假设。下面主要讨论参数假设检验的问题。参数假设检验举例:,例1:根据1989年的统计资料,某地女性新生儿的平均体重 为3190克。为判断该地1990年的女性新生儿体重与1989年相比有无显著差异,从该地1990年的女性新生儿中随机抽取30人,测得其平均体重为3210克。从样本数据看,1990年女新生儿体重比1989年略高,但这种差异可能是由于抽样的随机性带来的,也许这两年新生儿的体重并没有显著差异。究竟是否存在显著差异?可以先假设这两年新生儿的体重没有显著差异,然后利用样本信息检验这个假设能否成立。这是一个关于总体均值的假设检验问题。,例2:某种大量生产的袋装食品,按规定每袋重量不得少于2
5、50克,现从一批该种食品中任意抽取50袋,发现有6袋重量低于250克。若规定食品不符合标准的比例达到5就不得出厂,问该批食品能否出厂。可以先假设该批食品的不合格率不超过5,然后用样本不合格率来检验假设是否正确。这是一个关于总体比例的假设检验问题。,2.假设检验的基本思想,假设检验所依据的基本原理是小概率原理。什么是小概率?概率是01之间的一个数,因此小概率就是接近0的一个数著名的英国统计家Ronald Fisher 把20分之1作为标准,也就是0.05,从此0.05或比0.05小的概率都被认为是小概率Fisher没有任何深奥的理由解释他为什么选择0.05,只是说他忽然想起来的,什么是小概率原理
6、?,小概率原理发生概率很小的随机事件(小概率事件)在一次实验中几乎是不可能发生的。根据这一原理,可以先假设总体参数的某项取值为真,也就是假设其发生的可能性很大,然后抽取一个样本进行观察,如果样本信息显示出现了与事先假设相反的结果且与原假设差别很大,则说明原来假定的小概率事件在一次实验中发生了,这是一个违背小概率原理的不合理现象,因此有理由怀疑和拒绝原假设;否则不能拒绝原假设。检验中使用的小概率是检验前人为指定的。,下面我们用一例说明这个原则.,小概率事件在一次试验中基本上不会发生.,这里有两个盒子,各装有100个球.,小概率事件在一次试验中基本上不会发生.,现从两盒中随机取出一个盒子,问这个盒
7、子里是白球99个还是红球99个?,小概率事件在一次试验中基本上不会发生.,我们不妨先假设:这个盒子里有99个白球.,现在我们从中随机摸出一个球,发现是,此时你如何判断这个假设是否成立呢?,假设其中真有99个白球,摸出红球的概率只有1/100,这是小概率事件.,这个例子中所使用的推理方法,可以称为,小概率事件在一次试验中竟然发生了,不能不使人怀疑所作的假设.,带概率性质的反证法,不妨称为概率反证法.,小概率事件在一次试验中基本上不会发生.,它不同于一般的反证法,概率反证法的逻辑是:如果小概率事件在一次试验中居然发生,我们就以很大的把握否定原假设.,一般的反证法要求在原假设成立的条件下导出的结论是
8、绝对成立的,如果事实与之矛盾,则完全绝对地否定原假设.,在假设检验中,我们称这个小概率为显著性水平(Level of significance),用 表示.常取 简而言之,我们确定拒绝原假设时究竟需要多大的把握性,取决于我们所涉及问题的重要性。,的选择要根据实际情况而定.,社会学家惯用0.05的概率作为拒绝原假设的依据。但对许多管理问题而言,0.05的概率所隐藏的风险可能太大。如120急救中心可以确认,一个员工在任意一天不能够处理所有可能求援电话的概率是0.05,这就意味着每隔20天就有一天,或每3星期就有一次无法对病人进行援助,这个场合中,0.05的水平包含风险太大,0.001的水平,或说3
9、年失败一次的风险,可能更容易被接受。对于警察局,一辆警车的出警概率为0.05是可以接受的。但对于消防队而言,必须确保自己的消防水管失灵的概率不超过0.0001。,的选择要根据实际情况而定.,假设检验的基本思想,.因此我们拒绝假设=50,样本均值,m,=50,抽样分布,H0,假设检验的两个特点:,第一,假设检验采用逻辑上的反证法,即为了检验一个假设是否成立,首先假设它是真的,然后对样本进行观察,如果发现出现了不合理现象,则可以认为假设是不合理的,拒绝假设。否则可以认为假设是合理的,接受假设。第二,假设检验采用的反证法带有概率性质。所谓假设的不合理不是绝对的,而是基于实践中广泛采用的小概率事件几乎
10、不可能发生的原则。至于事件的概率小到什么程度才算是小概率事件,并没有统一的界定标准,而是必须根据具体问题而定。,假设检验的两个特点:,如果一旦判断失误,错误地拒绝原假设会造成巨大损失,那么拒绝原假设的概率就应定的小一些;如果一旦判断失误,错误地接受原假设会造成巨大损失,那么拒绝原假设的概率就应定的大一些。小概率通常用 表示,又称为检验的显著性水平。通常取0.05或0.01,即把概率不超过0.05或0.01的事件当作小概率事件。,3.假设的设立:原假设和备择假设,假设检验中,我们称作为检验对象的待检验假设为原假设或零假设,用H0表示。原假设的对立假设称为备择假设或备选假设,用H1表示。例如,设0
11、为总体均值的某一确定值。例1.对于总体均值是否等于某一确定值0的原假设可以表示为:H0:0(如H0:3190克)其对应的 备择假设则表示为:H1:0(如H1:3190克),原假设和备择假设,例2.对于总体均值是否小于某一确定值0的原假设可以表示为:H0:0(如H0:5)其对应的备择假设则表示为:H1:0(如H1:5)注意:原假设总是有等号:=或 或,4.假设检验:双侧检验和单侧检验,根据假设的形式不同,假设检验可以分为双侧假设检验和单侧假设检验。若原假设是总体参数等于某一数值,如H0:0,即备择假设H1:0,那么只要0和0 二者中有一个成立,就可以否定原假设。这种假设检验称为双侧检验。,4.假
12、设检验:双侧检验和单侧检验(续),若原假设是总体参数大于等于或小于等于某一数值,如H0:0(即H1:0);或H0:0(即H1:0),那么对于前者当0时,对于后者当0 时,可以否定原假设。这种假设检验称为单侧检验。可以分为左侧检验和右侧检验。,双侧检验与单侧检验(假设的形式),5.假设检验中的拒绝域和接受域,在规定了检验的显著性水平后,根据容量为n的样本,按照统计量的理论概率分布规律,可以确定据以判断拒绝和接受原假设的检验统计量的临界值。临界值将统计量的所有可能取值区间分为两个互不相交的部分,即原假设的拒绝域和接受域。对于正态总体,总体均值的假设检验可有如下图示:,正态总体,总体均值假设检验图示
13、:(1)双侧检验,设H0:0,H1:0,有两个临界值,两个拒绝域,每个拒绝域的面积为/2。也称双尾检验。,双侧检验示意图,0,双侧检验示意图(显著性水平与拒绝域),双侧检验示意图(显著性水平与拒绝域),观察到的样本统计量,双侧检验示意图(显著性水平与拒绝域),观察到的样本统计量,双侧检验示意图(显著性水平与拒绝域),观察到的样本统计量,(2)单侧检验有一个临界值,一个拒绝域,拒绝域的面积为。分为左侧检验和右侧检验两种情况。单侧检验示意图(显著性水平与拒绝域),1)左侧检验,设H0:0,H1:0;临界值和拒绝域均在左侧。也称下限检验。,0,左侧检验示意图(显著性水平与拒绝域),左侧检验示意图(显
14、著性水平与拒绝域),观察到的样本统计量,2)右侧检验,设H0:0,H1:0;临界值和拒绝域均在右侧。也称上限检验。,0,右侧检验示意图(显著性水平与拒绝域),右侧检验示意图(显著性水平与拒绝域),观察到的样本统计量,6.假设检验的两类错误,根据假设检验做出判断无非下述四种情况:原假设真实,并接受原假设,判断正确原假设不真实,且拒绝原假设,判断正确原假设真实,但拒绝原假设,判断错误原假设不真实,却接受原假设,判断错误,6.假设检验的两类错误,假设检验是依据样本提供的信息进行判断,有犯错误的可能。所犯错误有两种类型:第一类错误是原假设H0为真时,检验结果把它当成不真而拒绝了。犯这种错误的概率用表示
15、,也称作错误(error)或弃真错误。第二类错误是原假设H0不为真时,检验结果把它当成真而接受了。犯这种错误的概率用表示,也称作错误(error)或取伪错误。,假设检验的两类错误正确决策和犯错误的概率可以归纳为下表:,假设检验中各种可能结果的概率,假设检验两类错误关系的图示以单侧上限检验为例,设H0:0,H1:0,弃真错误区,取伪错误区,从上图可以看出,如果临界值沿水平方向右移,将变小而变大,即若减小错误,就会增大犯错误的机会;如果临界值沿水平方向左移,将变大而变小,即若减小错误,也会增大犯错误的机会。,图(a)0H0为真图(b)10H0为伪,错误和 错误的关系,在样本容量n一定的情况下,假设
16、检验不能同时做到犯和两类错误的概率都很小。若减小错误,就会增大犯错误的机会;若减小错误,也会增大犯错误的机会。要使和同时变小只有增大样本容量。但样本容量增加要受人力、经费、时间等很多因素的限制,无限制增加样本容量就会使抽样调查失去意义。因此假设检验需要慎重考虑对两类错误进行控制的问题。,7.假设检验中的P值(P-value),P值是用于确定是否拒绝原假设的另一重要工具,是现代统计检验中常用的检验统计量。传统的统计量检验方法是事先确定检验的显著性水平,明确拒绝域,检验时只要检验统计量的值落入拒绝域就拒绝原假设。但只给出检验结论可靠性(或犯弃真错误)的大致范围,无法给出某一样本观测结果与原假设不一
17、致程度的精确度量。P值是当原假设为真时,得到特定样本观测结果及更极端结果的概率,其具体取值可以用计算机统计软件计算出来。如果P值很小,说明这种样本观测结果出现的可能性很小,有理由拒绝原假设。P值越小,拒绝原假设的理由就越充分。,影响P值的因素:样本数据与原假设值之间的差异样本量的大小被假设参数的总体分布利用P值进行假设检验的准则:将P值与事先确定的检验显著性水平进行比较,若P值小于,说明小概率事件发生,则拒绝原假设;若P值大于,说明小概率事件没有发生,则不能拒绝原假设。,双侧检验的P 值图示,抽样分布图,左侧检验的P 值图示,右侧检验的P 值图示,样本统计量,8.假设检验的步骤,1.问题的提出
18、2.根据研究需要提出原假设H0和备择假设H13.确定适当的检验统计量4.确定显著性水平和临界值及拒绝域5.作出拒绝或接受原假设的决策,8.假设检验的步骤(续1),(一)根据研究需要提出原假设H0和备择假设H1应该注意:对任一假设检验问题,其所有可能结果均应包括在所提出的两个对立假设中,原假设与对立假设总有一个、也只能有一个成立。原假设一定要有等号:或 或。原假设不是随意提出的,应该本着“不轻易拒绝原假设”的原则。,双侧检验原假设与备择假设的确定,双侧检验属于决策中的假设检验。即不论是拒绝H0还是接受H0,都必需采取相应的行动措施。例如,某种零件的尺寸,要求其平均长度为10厘米,大于或小于10厘
19、米均属于不合格。待检验问题是该企业生产的零件平均长度是10厘米吗?(属于决策中的假设)则建立的原假设与备择假设应为 H0:=10 H1:10,单侧检验原假设与备择假设的确定,应区别不同情况采取不同的建立假设方法。对于检验某项研究是否达到了预期效果一般是将研究的预期效果(希望、想要证明的假设)作为备择假设H1,将认为研究结果无效作为原假设H0。先确立备择假设H1。因为只有当检验结果与原假设有明显差别时才能拒绝原假设而接受备择假设,原假设不会轻易被拒绝,就使得希望得到的结论不会轻易被接受,从而减少结论错误。,单侧检验原假设与备择假设的确定,例1,有研究预计,采用新技术生产后将会使某产品的使用寿命明
20、显延长到1500小时以上。则建立的原假设与备择假设应为:H0:1500 H1:1500例2,有研究预计,改进生产工艺后会使某产品的废品率降低到2%以下。则建立的原假设与备择假设应为:H0:2%H1:2%,单侧检验原假设与备择假设的确定,对于检验某项声明的有效性一般可将所作的声明作为原假设。将对该声明的质疑作为备择假设。先确立原假设H0。因为除非有证据表明“声明”无效,否则就应认为该“声明”是有效的。例1,某灯泡制造商声称,该企业生产的灯泡平均使用寿命在1000小时以上。通常除非样本能提供证据表明使用寿命在1000小时以下,否则就应认为厂商的声称是正确的。建立的原假设与备择假设应为:H0:100
21、0 H1:1000,单侧检验原假设与备择假设的确定,对于上述问题还可以结合不同背景建立假设。同样的问题背景不同可以采用不同的原假设。例如,一商店经常从某工厂购进某种商品,该商品质量指标为,值愈大商品质量愈好。商店提出的进货条件是按批验收,只有通过假设“0”检验的批次才能接受。有两种可能情况:如果根据过去较长时间购货记录,商店相信该厂产品质量好,于是同意把原假设定为0,而且选择较低的检验显著性水平。这对工厂是有利的,使得达到质量标准的产品以很小的概率被拒收。虽然这会使商店面临接受不合标准产品的风险,但历史记录显示出现这种情况的可能性很小,而且商店也可因此获得较好的货源。如果过去一段时期的记录表明
22、,该厂产品质量并不理想,商店则会坚持以0为原假设,并选定较小的检验显著性水平。这对商店是有利的,不会轻易地拒绝原假设,有 1的可能把劣质产品拒之门外。,确定适当的检验统计量,假设检验根据检验内容和条件不同需要采用不同的检验统计量。在一个正态总体的参数检验中,Z统计量和t统计量常用于均值和比例的检验,2统计量用于方差的检验。选择统计量需考虑的因素有被检验的参数类型、总体方差是否已知、用于检验的样本量大小等。,确定适当的检验统计量,假设检验根据检验内容和条件不同需要采用不同的检验统计量。在一个正态总体的参数检验中,Z统计量和t统计量常用于均值和比例的检验,2统计量用于方差的检验。选择统计量需考虑的
23、因素有被检验的参数类型、总体方差是否已知、用于检验的样本量大小等。,8.总体均值的假设检验检验统计量的确定,总体标准差 是否已知?,用样本标准差S代替,几种主要类型的假设检验实例,1.总体方差2已知时均值的检验(归纳)假定条件总体服从正态分布若总体不服从正态分布,可用正态分布来近似(要求n30)使用Z统计量,1.1 总体方差2 已知时均值的双侧检验某机床厂加工一种零件,根据经验知道,以前加工零件的椭圆度近似服从正态分布,其总体均值为0=0.081mm,总体标准差为=0.025。今换一种新机床进行加工,抽取n=200个零件进行检验,得到的椭圆度均值为0.076mm。试问新机床加工零件的椭圆度均值
24、与以前有无显著差异?(0.05),解:已知:0=0.081mm,=0.025,n=200,提出假设:假定椭圆度与以前无显著差异 H0:=0.081 H1:0.081=0.05双侧检验/2=0.025 查表得临界值:Z0.025=1.96,决策:,Z值落入拒绝域,在=0.05的水平上拒绝H0,结论:有证据表明新机床加工的零件的椭圆度与以前有显著差异,得两个拒绝域:(-,-1.96)和(1.96,)计算检验统计量值:,总体方差2 已知均值的检验(P 值的计算与应用),第1步:进入Excel表格界面,选择“插入”下拉菜单第2步:选择“函数”点击第3步:在函数分类中点击“统计”,在函数名的菜单下选择字
25、符“NORMSDIST”然后确定第4步:将Z的绝对值2.83录入,得到的函数值为 0.9976726。表示标准正态分布曲线下Z值2.83左侧的面积为0.9976726。双侧检验计算P值:2(10.9976726)=0.0046548 P值远小于=0.05,故拒绝H0,1.2总体方差2 已知时均值的单侧检验(归纳),1.2总体方差2已知时均值的单侧检验(左检验举例),某批发商欲从生产厂家购进一批灯泡,根据合同规定,灯泡的使用寿命平均不能低于1000小时。已知灯泡使用寿命服从正态分布,标准差为20小时。在总体中随机抽取100只灯泡,测得样本均值为960小时。批发商是否应该购买这批灯泡?(0.05)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 假设检验完全 假设检验 完全 PPT 课件

链接地址:https://www.31ppt.com/p-5464700.html