假设检验.doc
《假设检验.doc》由会员分享,可在线阅读,更多相关《假设检验.doc(21页珍藏版)》请在三一办公上搜索。
1、目 录第六章 假设检验2第一节 假设检验概述3一、假设检验的基本思想3二、假设检验的步骤4三、两类错误和假设检验的规则4第二节 总体均值的检验5一、单个正态总体均值的检验5二、两个正态总体均值之差的检验8三、两个非正态总体均值之差的检验10第三节 总体成数的检验12一、单个总体成数的检验12二、两个总体成数之差的检验13第四节 总体方差的检验14一、一个正态总体方差的检验14二、两个正态总体方差之比的检验15英文摘要与关键词17习 题17第六章 假设检验通过本章的学习,我们应该知道:1. 假设检验的基本思想与步骤2. 在各种条件下做均值检验3. 在各种条件下做成数检验4. 在各种统计下做方差检
2、验5. Excel中有关假设检验的功能假设检验是与参数估计同等重要的又一类统计推断问题。假设检验技术不仅可以对总体分布的某些参数,而且也可以对总体本身的分布做出假设,通过对样本的统计分析来判定该假设是否成立,从而对总体分布给以进一步的确认。本章在简要介绍假设检验原理的基础上,重点讨论总体参数的假设检验问题。第一节 假设检验概述一、假设检验的基本思想所谓假设检验就是对一个关于总体参数或总体分布形式的假设,利用样本资料来检验其真或伪的可能性。具体来说,就是利用样本资料计算出有关的检验统计量,再根据该统计量的抽样分布理论来判断样本资料对原假设是否有显著的支持性或排斥性,即在一定的概率下判断原假设是否
3、合理,从而决定应接受或否定原假设。所以,假设检验也称为显著性检验。对总体参数(平均数、成数、方差等)所作的假设进行检验称为参数假设检验,简称参数检验(parametric tests);对总体分布形式的假设进行检验一般称为非参数检验或自由分布检验。这里只讨论总体参数的假设检验,即参数检验;非参数检验在第八章中研究。我们再回到第五章开篇的例子上来说明假设检验的基本原理。【例6.1】假如雪碧瓶的标签上标明的容量为500毫升,如果你从市场上随机抽取25瓶,测得其平均含量为499.5毫升,标准差为2.63毫升。据此,可否断定饮料厂商欺骗了消费者?(假定饮料的容量服从正态分布)【分析】样本平均含量低于厂
4、商声称的平均含量,其原因不外乎有两种:一是由抽样误差引起的。如果样本平均数与总体平均数之差不大,未超出抽样误差范围,则可认为两者之差就是由抽样误差引起的,饮料厂商不存在欺诈行为。二是由饮料厂商短斤少两引起的,即饮料厂商存在欺诈行为。在这种情况下,样本平均数与总体平均数之差就会超出抽样误差范围,因为其差异是厂商的有意行为。我们知道,抽样误差范围是与置信水平相联系的。对于正态分布总体,若取置信水平为99%,注意到实际的样本均值小于总体均值,则样本平均数与总体平均数的真值之差小于抽样平均误差的-2.33倍这一情况发生的概率只有1%,即或发生的概率只有1%,如图7.1。因此,是一个小概率事件,这一事件
5、在100次抽样中只发生一次,而对于一次抽样而言,可认为小概率事件实际上不会发生。图7.1 1%概率示意图(=0.01)【解】在本例中,=499.5,=2.63,=50,假设=500也就是说,对于一次抽样的结果,如果小概率事件发生了,这是不合常理的,可认为原假设不成立,即雪碧容量小于500毫升;但对于本例,由于这次抽样的结果,小概率事件没有发生,所以没有充分的理由认为总体平均数这一假设成立,故没有充分的证据证明瓶装雪碧饮料的容量不足500毫升,即没有充分的证据证明厂商存在故意欺诈。通过这个例子可见,假设检验的基本思想是:先做出一个假设,然后依据小概率事件在一次抽样中实际上不会发生的推断原则,看这
6、一假设是否会导致不合理的结果,从而判断是否拒绝原假设。二、假设检验的步骤1. 提出原假设(Null Hypothesis)和备择假设(Alternative Hypothesis)原假设又称零假设,是对未知总体参数做出的、正待检验的假设。备择假设是对立假设,其含义是,一旦否定原假设,这个假设供你选择。例6.1中,原假设:=500,而备择假设:500。一般而言,若原假设: 为总体某个参数,根据具体问题,备择假设可由三种选择:(1)备择假设:,这种类型的假设检验称为双侧检验。(2)备择假设:,这种类型的假设检验称为右侧检验。(3)备择假设:,这种类型的假设检验称为左侧检验。右侧检验和左侧检验统称为
7、单侧检验。采用双侧检验还是单侧检验,应视所研究的问题的性质而定。2. 设计检验统计量所设计的检验统计量应与原假设相关,与待检验参数的估计量相关,但不能包含待检验的未知参数,且能够知道当原假设为真时该统计量的具体分布。上例中,检验统计量为,它服从自由度为49的t分布。3. 给定显著性水平和确定相应的临界值显著性水平表示假设为真时拒绝原假设的概率,也就是拒绝原假设所冒的风险,用表示。一般取值很小,常取0.1、0.05、0.01。给定了显著性水平,也就确定了原假设的接受区域和拒绝区域。这两个区域的交界点就是临界值。比如取0.05,则意味着原假设为真时,检验统计量落在其拒绝区域内的概率只有5%,而落入
8、其接受区域内的概率为95%。应当指出,对于同一的显著性水平,选择不同的检验统计量,得到的临界值是不同的;对于同一的显著性水平和同一的统计量,双侧检验和单侧检验的临界值也是不同的,如图6.2。双侧左侧右侧图6.2 双侧检验和单侧检验的临界值4. 依据假设检验的规则,由样本资料计算出检验统计量的实际值,与临界值比较,视实际值落入接受区域还是拒绝区域,做出接受或拒绝原假设的结论。三、两类错误和假设检验的规则通过假设检验,拒绝原假设是在认为小概率事件在一次抽样中实际上不会发生的前提下做出的,事实上小概率事件有时也可能发生;接受原假设,是因为拒绝它的理由还不充分,并非认为它绝对正确。因此,由假设检验做出
9、的判断不可能百分之百正确。一般来说,决策结果可归纳为表6.1表现的四种情况:表6.1 假设检验决策结果表是真实的是不真实的拒绝第类错误()正确接受正确第类错误()由假设检验做出的决策既可能犯“弃真错误”又可能犯“取伪错误”。“弃真错误”称作假设检验的“第类错误”,“取伪错误”称作假设检验的“第类错误”。假设检验犯第类错误的原因是,在原假设为真的情况下,检验统计量不巧刚好落入小概率的拒绝区域,从而导致拒绝了原假设。因而,第类错误发生的概率就是显著性水平。第类错误发生的概率记为。概率与是密切相关的,在样本一定的条件下,减小,就增大了;反之,增大,就减小了,见示意图6.3。检验统计量在备择假设下的分
10、布密度检验统计量在原假设下的分布密度图6.3 假设检验中犯两类错误情况示意图这里用法庭对被告进行审判的实例来说明。由于法庭采用无罪推定的审判准则,在证明被告有罪之前先假定他是无罪的,即原假设:被告无罪,备择假设:被告有罪。法庭可能犯的第类错误是:被告无罪但判他有罪,即冤枉了好人;第类错误是:被告有罪但判他无罪,即放过了坏人。为了减少冤枉好人的概率,应尽可能接受原假设,判被告无罪,而这有可能增大了放过坏人的概率;反过来,为了不放过坏人,减少放过坏人的概率,相应地就又增加了冤枉好人的可能性。当然,这只是在一定的证据下的两难选择。如果进一步收集有关的证据,在充分的证据下,就有可能做到既不冤枉好人,又
11、不放过坏人。鉴于犯第类与第类错误的概率与的相互关系,在一定的样本容量下,期望两者都非常小是困难的。从而,在假设检验中,内曼(J. Neyman)和皮尔生(Egon S. Pearson)提出了一个原则,即在控制犯第类错误的概率的条件下,尽可能使犯第类错误的概率减小。在假设检验实践中,该原则的含义是,原假设要受到维护,使它不致被轻易否定,若要否定原假设,必须有充分的理由。第二节 总体均值的检验一、单个正态总体均值的检验样本来自正态总体(一) 如果总体方差已知-检验构造检验统计量: (6.1)当时,服从。给定显著性水平,则有(1) 检验规则为:当时,拒绝;当时,不能拒绝(2) 检验规则为:当时,拒
12、绝;当时,不能拒绝(3) 检验规则为:当时,拒绝;当时,不能拒绝以上三个假设检验的拒绝区域如图6.2所示,拒绝区域的面积为。【例6.2】某企业从长期实践得知,其产品直径X服从正态分布。从某日产品中随机抽取10个,测得其直径分别为14.8,15.3,15.1,15.0,14.7,15.1,15.6,15.3,15.5,15.1(单位:厘米)。问在显著性水平=0.05时,该产品直径是否符合直径为15.0厘米的质量标准?【解】依题意建立假设:15.0 :15.0根据检验统计量(6.1) 若取显著性水平=0.05,则由标准正态分布表(见附表二),得。从而拒绝,即认为直径不符合质量标准。若取显著性水平=
13、0.01,则由标准正态分布表,得。从而不能拒绝,即认为没有充分的理由说明直径不符合质量标准。教师:这个题目实际上就是第五章习题中的第一题。当我们以95%的置信度进行区间估计时,结果是15.03-15.27厘米之间,显然15不在其范围之内,这和我们这里的“拒绝”是一个意思;如果我们以99%的置信度,则结果是:14.09-15.31厘米之间,显然15是在其范围之内的,这又和我们这里的“不能拒绝”同义。其实参数估计和假设检验都是以抽样分布为理论依据,根据样本信息对总体参数进行推断,对某一具体问题而言,两者是可以相互转换的。【例6.3】某企业职工上月平均奖金为402元,本月随机抽取50人来调查,其平均
14、奖金为412.4元。现假定本月职工收入服从正态分布,问在0.05的显著性水平下,能否认为该企业职工平均奖金本月比上月有明显提高?【解】依题意建立假设:402 :402检验统计量 显著性水平=0.05,则由标准正态分布表,得。从而拒绝,即认为该企业职工平均奖金本月比上月有明显提高。教师:这里特别要提醒的是,对应同一张标准正态分布表,在同一个显著性水平上,单侧和双侧是不同的。以我们提供的表为例,=0.05时,如果是单侧检验,只要查0.95(即1-0.05)即可;如果是双侧检验,则需要查0.975(即1-0.05/2)。为什么?你们画画图就能想通了。(二) 如果总体方差未知-检验构造检验统计量: 其
15、中是样本标准差 (6.2)当时,根据抽样分布理论,统计量服从。(t分布表见附录三,df表示自由度),给定显著性水平,则有(1) 检验规则为:当时,拒绝;当时,不能拒绝(2) 检验规则为:当时,拒绝;当时,不能拒绝(3) 检验规则为:当时,拒绝;当时,不能拒绝以上三个假设检验的拒绝区域如图6.2所示,拒绝区域的面积为。因为,t分布与正态分布很相似,当n大于30以后,两者就基本重合了,见图6.4。图6.4 t分布与正态分布【例6.4】 抽取某地区粮食样品9个,测得其中六六六的平均值为0.325mg/kg,标准差为0.068mg/kg,国家卫生标准规定,粮食中六六六残留量0.3mg/kg。假定粮食中
16、六六六残留量服从正态分布,问该地区粮食中六六六残留量是否超标?【解】依题意建立假设:0.3 :0.3根据检验统计量(6.2) 若取显著性水平=0.05,则由分布表(见附表三),得。从而不能拒绝,即没有足够的证据说明该地区粮食中六六六残留量超标。假如我们增加样本容量,如抽取样品25个,还是得到一样的数据,那么:还取显著性水平=0.05,则由分布表,得。从而,拒绝,即说明该地区粮食中六六六残留量超标。教师:从这个对比的例子中,有两个值发生了变化:一是实际的t值,它变大了,含义是它倾向于拒绝原假设;二是t的临界值,它变小了,含义是拒绝区变大。这说明在样本量较小的时候,我们把看似和备择假设一致的事实视
17、作为是抽样造成的,显然这就保护了原假设。而当样本量增加以后,才认为有足够的证据证明这一事实。t检验一般用于小样本检验,往往是已知服从正态总体但方差未知。随着样本容量n的增大,t分布趋近于标准正态分布,(有些t分布表就编到30为止,超过30的就查正态分布表了。)所以在大样本情形下,总体方差未知时对总体均值的假设检验可近似采用z检验。对于非正态总体,大样本的情况下,在对总体均值假设检验时,也可采用z检验,选择检验统计量为公式(6.1),如果未知,可以用s替代。二、两个正态总体均值之差的检验样本来自正态总体,来自正态总体(一) 如果两个总体方差和已知构造检验统计量: (6.3)当时,服从。因此,采用
18、检验。【例6.5】 假设某种羊毛的含脂率服从正态分布,且处理前后的方差均为36。处理前采10个样,测得平均含脂率为27.3,处理后采8个样,测得平均含脂率为13.75,问处理前后羊毛含脂率有无显著变化()?解 依题意建立假设: :根据检验统计量(6.3) 由标准正态分布表,得。从而拒绝,即认为处理前后羊毛含脂率有显著变化。(二) 如果两个总体方差和未知但相等,即构造检验统计量: (6.4)其中:当时,服从。因此,采用检验。【例6.6】某废水中的镉含量服从正态分布,现用标准方法与新方法同时测定该样本中镉含量。其中新方法测定10次,平均测定结果为5.28ug/L,标准差为1.11ug/L;标准方法
19、测定9次,平均测定结果为4.03ug/L,标准差为1.04ug/L。问两种测定结果有无显著性差异?【解】依题意建立假设: :根据检验统计量(6.4) 取显著性水平=0.05,。从而,拒绝,即认为两种测定结果有显著性差异。三、两个非正态总体均值之差的检验样本和来自两个非正态总体,当样本容量和较大()时,构造检验统计量:或 (6.5)当时,近似服从。因此,两个非正态总体均值之差的检验可采用检验。【例6.7】根据数据集03,整理出256名男职工和214名女职工的薪水资料,问能否认为男职工的年薪比女职工的要高出15000元或高出12000元(=0.05)? 【解】依题意建立假设: :这里的计算量比较大
20、,我们可以让计算机来帮忙。Excel解决方案 在数据集03中按性别分类摘出两列分性别的薪水资料,并计算两列数据的方差 选择菜单“工具”“数据分析”,打开“数据分析”对话框,见图2.9 选择其中的“z检验:双样本平均差检验”,打开对话框,见图6.5 正确填写相关信息后,点“确定”,结果在G7到I18这个区域内显示,见图6.6图6.5 “z检验:双样本平均差检验”分析工具对话框图6.6 “z检验:双样本平均差检验”结果截图看G7到I18这个区域内的显示:z=0.1911,这就是我们计算的实际z值,由于本例是单侧检验,所以看z单尾临界,这里显示的是1.6448,和我们查表的结果一致。因而,我们不能拒
21、绝,即认为没有充分的理由说明男职工的年薪比女职工的高出15000元。若在图6.5的假设平均差处改为“12000”,就是对: :的检验了。我们看其在G27到I32中的结果:z=2.5192,而临界值还是1.6448,因而,我们拒绝,即认为男职工的年薪比女职工的高出12000元。学生:老师,在z单尾临界的上面一行“P(Z=z)单尾”是什么意思?有什么用?教师:“P(Z=z)单尾”提供的是实际z值所对应的概率,即根据样本资料计算出来的拒绝原假设所需的最低显著性水平,称为实测显著性水平。前面我们是根据给定的显著性水平,查表得到临界值,然后实际值与临界值对比,如果实际值大于临界值就拒绝原假设,反之,则接
22、受原假设。我们也可以这样:根据计算得到的统计量的实际值,查表或用Excel的统计函数,找出这个实际值所对应的概率,然后用这个概率与显著性水平比较,如果它大,则不能拒绝原假设,如果它小,则拒绝原假设。后一种方法是目前国际上流行的利用统计软件进行假设检验的格式。所以,我们也可以这样判断,对第一问的检验,由于p值为0.4242,它大于0.05的显著性水平,故不能拒绝;对第二问,由于p值为0.0059,它小于0.05的显著性水平,故拒绝,如果我们把显著性水平定在0.005,则又不能决绝了。Excel还提供了三个有关t检验的分析工具,我们如果碰到大量的数据处理,就可以直接用这些工具来解决问题。学生:这里
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 假设检验

链接地址:https://www.31ppt.com/p-4201281.html