第4章--假设检验-《管理统计学》课件.ppt

资源ID：3138399 资源大小：2.89MB 全文页数：92页
资源格式： PPT 下载积分：16金币

快捷下载

会员登录下载

三方登录下载：

下载资源需要16金币

邮箱/手机：
温馨提示：	用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）
支付方式：
验证码：	换一换

加入VIP免费专享

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？

友情提示

1、下载资料失败解决办法

2、PDF文件下载后，可能会被浏览器默认打开，此种情况可以点击浏览器菜单，保存网页到桌面，就可以正常下载了。

3、本站不支持迅雷下载，请使用电脑自带的IE浏览器，或者360浏览器、谷歌浏览器下载即可。

4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩，下载后原文更清晰。

5、试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓。

网站客服

侵权投诉

第4章--假设检验-《管理统计学》课件.ppt

第4章假设检验,4.1 假设检验的基本原理4.2 参数假设检验4.3 非参数假设检验,例：某种大量生产的袋装食品，按规定每袋重量不得少于250g。今从一批该种食品中任意抽取50袋，发现有6袋低于250g。若规定不符合标准的比例达到5，食品就不得出厂，问该批食品能否出厂。从2000年的新生儿中随机抽取30个，测得其平均体重为3210g,而根据1999年的统计资料,新生儿的平均体重为3190g,问2000年的新生儿与1999年相比，体重有无显著差异。,4.1.1 假设检验的定义,统计假设：关于总体的分布以及分布中所含参数的各种论断.假设检验：施加于一个或多个总体的概率分布或参数的假设假设总体分布的形式或总体的参数有某种特征判断原先的假设是否合理合理：承认假设的正确性不合理：否定原先的假设对问题作出分析或推断,假设检验的过程和思路概率意义下的反证法,总体,假设总体的平均年龄是35岁,样本均值是32岁,样本,样本均值,=35,基本原理,抽样分布,这是样本均值,如果这是总体均值,判断：拒绝or不拒绝零假设=35？,32,H0,4.1.2 假设检验的分类,假设检验包括：参数假设检验和非参数假设检验参数假设检验：X1,X2,Xn是来自分布形式已知、参数未知总体的样本，由其观测值检验假设H0:=0;H1:0,为已知实数非参数假设检验：X1,X2,Xn是来自分布形式未知总体的样本，由其观测值检验假设H0:F(x)=F0(x,);H1:F(x)F0(x,),F0(x,)为已知分布函数,4.1.3 假设检验的基本原理,假设检验的基本思想提出统计假设，根据小概率原理对其进行检验实际推断原理/小概率原理小概率事件：在某次试验或观测中，出现的概率很小的事件小概率事件在一次试验中几乎不会发生小概率事件发生，否定原来的假设,假设检验基本原理,假设检验的基本思想,前提：承认原假设,小概率事件发生,大概率事件发生,拒绝原假设,接受原假设,进行一次实验,4.1.4 原假设和备择假设,假设检验的三种形式左尾检验、右尾检验和双尾检验H0为原假设，H1为备择假设,原假设与备择假设的确定,若想支持某种假设，把它作为备择假设，把该陈述的否定假设作为原假设两种假设互斥且完备，接受H0，必须拒绝H1一个特定形式的H1不只与唯一的H0相对,4.1.5 假设的两类错误分析,4.1.5 假设的两类错误分析,4.1.5 假设的两类错误分析,两类错误的对比情况表为拒真概率，为存伪概率，1 为检验功效控制第一类型错误较为实际，即只分析原假设H0，这样的假设为显著性检验，为显著性水平,两类错误对比情况表,对于一定的样本容量n，不能同时做到两类错误的概率都很小。如果减小错误，就会增大犯错误的机会；若减小错误，也会增大犯错误的机会。,使、同时变小的办法就是增大样本容量。,一般地说，哪一类错误所带来的后果越严重，危害越大，在假设检验中就应当把哪一类错误作为首要的控制目标。但在假设检验中，一般均首先控制犯错误概率。,两类错误关系,4.1.6 总体参数检验的步骤,（1）提出假设根据检验目标，对待推断的总体参数或分布提出一个基本假设（2）决定检验的显著性水平由被检验的统计量分布求出相应的临界值该临界值为零假设的拒绝域和接受域的分界线（3）构造检验统计量，依据样本信息计算检验统计量的实际值（4）将实际求得的检验统计量取值与临界值进行比较，作出拒绝或接受零假设的决策p，不应拒绝零假设,举例1,某健身俱乐部主管经理估计会员的平均年龄是35岁，研究人员从2005年入会的新会员中随机抽取40人，调查得到他们的年龄数据如下。,试根据调查结果判断主管经理的估计是否准确？,提出原假设和备选假设,原假设（Null hypothesis）又称零假设，是需要通过样本推断其正确与否的命题，用H0表示。本例中可以提出：H0:m=35；这里m表示总体会员的平均年龄，意味着总体会员的平均年龄与主管经理估计的35岁没有差异。与原假设对立的假设是备选假设，用H1表示。在本例中，备选假设意味着“总体会员的平均年龄与主管经理估计的会员平均年龄35岁有显著差异”，可以表示为H1:m35。原假设与备选假设互斥，检验结果二者必取其一。,原假设,1.陈述需要检验的假设例如:H0:=352.零假设用 H0 表示3.代表“正常”的情形4.总是包含等号“=”5.检验以“假定原假设为真”开始,备择假设,1.为原假设的对立情况例如:H1:352.备择假设用H1表示 3.代表“不能轻易肯定的情况”4.很少包含等号,确定适当的检验统计量,假设检验需要借助样本统计量进行统计推断，称为检验统计量。不同的假设检验问题需要选择不同的检验统计量。在具体问题中，选择什么统计量，需要考虑的因素有：总体方差已知还是未知，用于进行检验的样本是大样本还是小样本，等等。在本例中，由于n=4030是大样本，所以近似服从正态分布，以样本标准差代替总体标准差，所用的统计量是：,选取显著性水平，确定接受域和拒绝域,显著性水平（Significant Level）：事先给定的形成拒绝域的小概率，用a表示。通常取a=0.01，a=0.05或a=0.10；这表明，当作出接受原假设的决定时，其正确的概率为99%，95%或90%。拒绝域：原假设 H0 成立条件下,统计量落入的小概率区域。接受域：统计量能够取值的非拒绝域。本例为双侧检验，有接受域：1.96z1.96拒绝域：z1.96,在实际应用中，一般是先给定了显著性水平，这样就可以由有关的概率分布表查到临界值（critical value），从而确定H0的接受域和拒绝域。对于不同形式的假设，H0的接受域和拒绝域也有所不同。,如图所示，双侧检验的拒绝域位于统计量分布曲线的两侧，左单侧检验的拒绝域位于统计量分布曲线的左侧，右单侧检验的拒绝域位于统计量分布曲线的右侧。,计算检验统计量的值,在提出原假设H0和备选假设H1，确定了检验统计量，给定了显著性水平a以后，接下来就要根据样本数据计算检验统计量的值。其计算的基本公式为：上式不是计算检验统计量的唯一公式在本例中，,作出统计决策,根据样本信息计算出统计量z的具体值，将它与临界值相比较，就可以作出接受原假设或拒绝原假设的统计决策。在本例中，由于z=3.1841.96，落在拒绝域内，所以拒绝原假设H0。可以得出结论：在a=0.05的显著性水平下，抽样结果的平均年龄显著低于主管经理的估计值，有理由认为经理的估计不准确。,4.2 参数假设检验,4.2.1 一个正态总体参数假设检验4.2.2 一个正态总体参数假设检验的SPSS应用4.2.3 两个正态总体参数假设检验4.2.4 两个正态总体参数假设检验的SPSS应用,假设检验的内容,假设检验,一个总体均值的假设检验,s未知,s已知,两个总体均值差的假设检验,4.2.1 一个正态总体参数假设检验,已知的Z检验,已知的Z检验,1.将样本统计量（如）转换为标准正态分布Z变量2.与Z的临界值比较如Z检验统计量的值落在临界域内则拒绝H0否则，不能拒绝H0,Z,X,X,x,x,/,已知，均值的双侧Z检验,1.假设总体服从正态分布；当(n 30)时，不服从正态分布的总体可以用正态分布来近似。2.零假设只有“=”号3.使用Z检验统计量,H0,临界值,临界值,1/2,1/2,样本统计量,拒绝域,拒绝域,非拒绝域,拒绝域,抽样分布,1,置信度,举例,2005年北京市职工平均工资为32808元，标准差为3820元。现在随机抽取200人进行调查，测定2006年样本平均工资为34400元。按照5%的显著性水平判断该市2006年的职工平均工资与2005有无显著差异？,解答,在本例题中，我们关心的是前后两年职工的平均工资有没有显著的差异，不涉及差异的方向，因此，本题属于双侧检验。检验过程如下：（1）提出假设：H0:m=32808；H1:m32808；（2）总体标准差s已知，大样本抽样，故选用Z统计量；（3）显著性水平a=0.05，由双侧检验，查表可以得出临界值：。判断规则为：若z1.96或z-1.96，则拒绝H0；若-1.96z 1.96，则不能拒绝H0。,（4）计算统计量Z的值（5）检验判断：由于，落在拒绝域，故拒绝原假设H0。结论：以5%的显著性水平可以认为该市2006年的职工平均工资比2005年有明显的差异。,已知，均值的单侧Z检验,1.假设总数服从正态分布；当(n 30)时，不服从正态分布的总体可以用正态分布来逼近。2.零假设只有或者号3.使用Z检验统计量,Z,0,Z,0,拒绝域,拒绝域,H0:0 H1:0,H0:0 H1:0,较小的m值与H0不矛盾.,拒绝域,1-,1,举例,已知某电子产品的使用寿命服从正态分布，根据历史数据，其平均使用寿命为8000小时，标准差为370小时。现采用新的机器设备进行生产，随机抽取了100个产品进行检测，得到样本均值为7910小时。试问在5%的显著性水平下，新的机器是否合格？,解答,这是一个左单侧检验问题。抽样的目的是为了检测新机器生产的产品的使用寿命是否达到标准，我们比较关心的是使用寿命的下限，如果新产品的使用寿命与过去相比没有明显降低，则说明所使用的新机器合格；反之，则说明新机器不合格。检验过程如下：（1）提出假设：H0:m8000；H1:m8000；（2）总体标准差s已知，大样本抽样，故选用Z统计量；（3）显著性水平a=0.05，由单侧检验，查表可以得出临界值,（4）计算统计量Z的值：（5）检验判断：由于，落在拒绝域；故拒绝原假设H0。即认为产品的使用寿命有明显降低，新机器不合格。,未知的大样本检验,1.假设总体服从正态分布；当(n 30)时，不服从正态分布的总体可以用正态分布来近似。2.使用Z检验统计量3.将样本统计量转换为标准正态分布Z变量4.与Z的临界值比较如Z检验统计量的值落在临界域内则拒绝H0否则，不能拒绝H0,举例,某乳制品厂生产的一种盒装鲜奶的标准重量是495克。为了检测产品合格率，随机抽取100盒鲜奶，测得产品的平均重量为494克，标准差为6克，试以5%的显著性水平判断这批产品的质量是否合格。,解答,产品的标准重量是495克，过轻或者过重都不符合产品质量标准。检验过程如下：（1）提出假设：H0:m=495；H1:m495；（2）总体标准差s未知，但是由于大样本抽样，故仍选用Z统计量（3）显著性水平a=0.05，由双侧检验，查表可以得出临界值（4）计算统计量Z的值，式中用s代替s：（5）检验判断：由于，落在接受域；故不能拒绝原假设H0，即不能说明这批产品的不符合质量标准。,未知的小样本检验,1.假设总体服从正态分布；2.使用t检验统计量4.t检验的决策规则:若采用双侧检验，临界值为-ta/2和ta/2。当-ta/2 t ta/2时，落入接受域，不能拒绝原假设；反之，则拒绝原假设。若采用左单侧检验，临界值为-ta。当t-ta时，落入拒绝域，拒绝原假设；反之，则不能拒绝原假设。,举例5,沿用例4，对鲜奶产品进行抽样检查，随机抽取10盒产品，测得每盒重量数据如下（单位：克）：496、499、481、499、489、492、491、495、494、502。试以5%的显著性水平判断这批产品的质量是否合格。,解答,根据前面的分析，本例题为双侧检验问题。检验过程如下：（1）提出假设：H0:m=495；H1:m495；（2）总体标准差s未知，小样本抽样，故仍选用t统计量；（3）当a=0.05，自由度n-1=9时，由双侧检验，查表可以得出临界值：计算得：（4）计算统计量t的值：（5）检验判断：由于，落在接受域；故不能拒绝原假设H0，即不能说明这批产品不符合质量标准。,未知方差2，检验假设0,提出零假设H0确定统计量T已知其分布和参数统计量的值可以计算计算统计量T值给出显著性水平，做出决策TT/2，拒绝H0,未知方差2，检验假设0,为未知方差 2，检验假设：0的特殊情况可由题意及统计量T的构成，确定T 0，仅考虑T T/2的情况,例4.1 样品直径均值检验,测得一批零件的20个样品的直径（单位：cm）假设直径服从正态分布，样本的均值与总体均值显著差别总体均值为5.20对样本的数据进行均值检验,One-Sample T Test对话框,AnalyzeCompare meansOne-Samples T test：One-Sample T Test在Test Value框中输入检验值,Test 列表框,用于输入总体均值,One-Sample T Test:Options对话框,置信度：50,99，默认值95,缺失值的处理方式,剔除计算时涉及变量含有缺失值的case,剔除在任意变量上含有缺失值的case,One-Sample T Test输出结果,单样本数据的统计表,数据个数,均值,标准差,均值的标准误差,总体均值,T统计量值,自由度,双尾显著性概率,均值差：样本均值与总体均值之间的差值,均值差的95%置信区间,4.2.3 两个正态总体下的参数假设检验,未知两个总体的均值1、2，检验假设H0：总体方差未知两个总体的均值1、2，检验假设H0：总体方差未知两个总体的方差，已知，检验假设H0：1=2未知两个总体的方差，已知，检验假设H0：1=2,未知总体均值1和2，检验H0：,统计量服从F(n-1，m-1)分布计算统计量F值，与F/2和F1-/2比较，做出决策,未知总体均值1和2，检验H0：,统计量服从F（n-1，m-1）分布计算统计量F值，与F比较，做出决策,未知总体方差，已知检验H0：1=2,统计量服从t(m+n-2)，n为来自总体X的样本数，m为来自总体Y的样本数计算统计量F值，tt/2，拒绝H0tt/2，接受H0,未知总体方差，已知检验H0：1=2,统计量检验过程同未知两个总体的方差，已知，检验假设H0：1=2 的检验,例4.2 独立样本的t检验,某企业统计了两种不同的膨化食品A和B分别在八家不同超市的日销量（箱）检验两种膨化食品的日销量是否有显著差异,Independent-Sample T Test对话框,AnalyzeCompare MeansIndependent-Samples T Test.,Test 列表框,分类变量,Define Groups对话框,不同变量值对应的数据将被用作检验对象,分别将大于等于与小于窗口中数值的数据作为两组进行t检验,One-Sample T Test:Options对话框,置信度：50,99，默认值95,缺失值的处理方式,剔除计算时涉及变量含有缺失值的case,剔除在任意变量上含有缺失值的case,Group Statistics输出表,分组统计表,数据个数,均值,标准离差,均值的标准误差,Independent Samples T Test输出表,方差齐性,方差非齐性,方差非齐性检验,等均值t检验,均值差异标准误差,例4.3 环境对液态产品的影响检验,不同压力环境A和B下的某液态产品的浓度数据检验不同环境对该液态产品的浓度是否有显著影响（零假设为没有显著影响）,Paired-Samples T Test对话框,AnalyzeCompare MeansPaired-Samples T Test,Test 列表框,配对变量,Paired-Samples T Test输出结果,配对样本统计表,配对样本t检验,4.3 非参数假设检验,4.3.1 符号检验法：通过两个相关样本的每对数据之差的符号进行检验，比较两个样本的显著性配对资料的符号检验样本中位数与总体中位数比较的符号检验4.3.2 秩和检验法：一种用样本秩来代替样本值的检验法，可用于检验两个总体的分布函数是否相等的问题配对试验资料符号秩和检验非配对试验资料符号秩和检验4.3.3 非参数假设检验的SPSS应用卡方检验柯尔莫哥洛夫-斯米诺夫检验,配对资料的符号检验,提出无效假设与备择假设H0：甲、乙两个处理差值d总体中位数 0H1：甲、乙两个处理差值d总体中位数0进行单尾检验，把“”换成“”或者“”计算差值并赋予符号d0，记为“”，“”个数记为nd0，记为“”，“”个数记为nd0，记为“0”，“0”个数记为n0统计量K min n，n 统计推断令n nnKK0.05(n)，P0.05，不能否定H0，两个处理差异不显著K0.01(n)KK0.05(n)，0.01P0.05，否定H0，接受H1，两个处理差异显著 KK0.01(n)，P0.01，否定H0，接受H1，两个处理差异极显著,提出无效假设与备择假设H0：样本所在的中位数已知总体的中位数H1：样本所在的中位数已知总体的中位数进行单尾检验，把“”换成“”或者“”计算差值，确定符号及其个数样本各观测值中大于已知总体中位数的，记为“”，“”个数记为n样本各观测值中小于已知总体中位数的，记为“”，“”个数记为n样本各观测值中等于已知总体中位数的，记为“0”，“0”个数记为n0统计量K min n，n 统计推断令n nnKK0.05(n)，P0.05，不能否定H0，样本中位数与已知总体中位数差异不显著K0.01(n)KK0.05(n)，0.01P0.05，否定H0，接受H1，样本中位数与已知总体中位数差异差异显著 KK0.01(n)，P0.01，否定H0，接受H1，样本中位数与已知总体中位数差异差异极显著,样本与总体中位数比较的符号检验,配对试验资料符号秩和检验,提出无效假设与备择假设H0：差值d总体中位数 0H1：差值d总体中位数0进行单尾检验，把“”换成“”或者“”编秩次，定符号求配对数据的差值d按d的绝对值从小到大编秩次根据原差值正负，在各秩次前标正负号d=0，舍去不记d的绝对值相等，取其平均秩次确定统计量TT为正秩次及负秩次和中绝对值较小者统计推断令正负差值的总个数为nTT0.05(n)，P0.05，不能否定H0，两个处理差异不显著T0.01(n)TT0.05(n)，0.01P0.05，否定H0，接受H1，两个处理差异显著 TT0.01(n)，P0.01，否定H0，接受H1，两个处理差异极显著,非配对试验资料符号秩和检验,提出无效假设与备择假设H0：甲样本所在的总体中位数乙样本所在的总体中位数H1：甲样本所在的总体中位数乙样本所在的总体中位数进行单尾检验，把“”换成“”或者“”求两个样本合并数据的秩次两个样本的含量为n1和n2，合并后为n1 n2合并后的数据按从小到大的顺序排列，序号即为数据的秩次不同样本的观测值相同，取原秩次的平均秩次同一样本的观测值相同，不必改动确定统计量T秩和较小的样本含量记为n1，秩和为T统计量统计推断T在T0.05(n1)-T0.05(n2n1)之内，P0.05，不能否定H0，两个处理差异不显著T在T0.05(n1)-T0.05(n2n1)之内外，在T0.01(n1)-T0.01(n2n1)之内，0.01P0.05，否定H0，接受H1，两个处理差异差异显著 T在T0.01(n1)-T0.01(n2n1)之外，P0.01，否定H0，接受H1，两个处理差异差异极显著,非参数假设检验方法,AnalyzeNonparametric Tests,非参数假设检验,卡方检验,二项检验,游程检验,K-S检验,两个独立样本的检验,多个独立样本的检验,两个相关样本的检验,多个相关样本的检验,4.3.3 非参数假设检验中的SPSS应用,卡方检验属于拟合优度检验适用于具有明显分类特征的数据检验某一类别的对象或反应的case数与根据零假设所得期望数是否有显著差异柯尔莫哥洛夫-斯米诺夫检验拟合优度型检验检验样本数据是否服从指定的理论分布设F0(x)是己知分布函数设Fn(x)是未知总体分布函数F(x)的一个较优估计取检验统计量D=max|Fn(x)-F0(x)|样本数据服从指定分布(即F(x)=F0(x)时，D的观测值应该较小若D的观测值较大，零假设可能不成立,一次观测中某厂家6条生产线每小时生产的产量该厂家不同生产线的生产能力有无显著性差异？,例4.4 生产能力差异性检验,Test 列表框,数据范围,取得全部数据,自定义数据,各组数据的期望值相等,自定义期望值,Chi-Square对话框,Exact Test与Options对话框,采用逼近方法计算显著性水平，适用于大样本,采用蒙特卡洛法计算显著性水平,最大迭代次数：1,1000000000,计算时间限制,统计量描述,显示描述性统计量,显示四分位数,缺失值的处理方式,卡方检验输出结果,对生产能力的统计,检验结果,例4.5 超市客流量情况分析,某连锁超市在某广场的入口处观察每分钟通过的人数拟考察该广场的人流情况后，再做入超市购物分析和盈利评估观测2000余次,One-Sample Kolmogorov-Smirnov Test对话框,Test 列表框,样本数据分布形式,正态分布,均匀分布,泊松分布,指数分布,One-Sample Kolmogorov-Smirnov Test假设为正态分布检验结果,显著性p0.01，样本与正态分布有显著差异,One-Sample Kolmogorov-Smirnov Test假设为均匀分布检验结果,显著性p0.01，样本与均匀分布有显著差异,One-Sample Kolmogorov-Smirnov Test假设为泊松分布检验结果,显著性p0.05，样本服从泊松分布,One-Sample Kolmogorov-Smirnov Test假设为指数分布检验结果,显著性p0.01，样本与指数分布有显著差异,

注意事项

本文（第4章--假设检验-《管理统计学》课件.ppt）为本站会员（小飞机）主动上传，三一办公仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知三一办公（点击联系客服），我们立即给予删除！

温馨提示：如果因为网速或其他原因下载失败请重新下载，重复下载不扣分。