概率论与数理统计第8章.ppt
第8章 假设检验,8.1 假设检验的基本概念,8.3 两个正态总体的参数假设检验,8.2 单个正态总体的参数假设检验,8.4 总体比率的假设检验,8.3 非参数假设检验,8.1 假设检验的基本概念,一、假设检验的概念,二、假设检验的基本原理,三、假设检验可能犯的两类错误,四、假设检验的一般步骤,若对总体参数有所了解,但有怀疑需要证实之时,用假设检验方法来处理,一、假设检验的概念,假设检验是指施加于一个或多个总体的概率分布或参数的假设.,所作假设可能是正确的,也可能是错误的.为判断所作的假设是否正确,从总体中抽取样本,根据样本的取值,按一定原则进行检验,然后作出接受或拒绝所作假设的决定.,例如,提出总体服从泊松分布的假设;,参数假设检验,非参数假设检验,参数检验假设是针对总体分布函数中的未知参数而,提出的假设进行检验;,分布函数形式或类型的假设进行检验.,本章主要讨论参数假设检验问题,,非参数检验假设是针对总体,下面结合实例来说明参数假设检验的基本思想.,例1 某产品出厂检验规定:次品率p不超过4%才能出厂.现从一万件产品中任意抽查12件发现3件次品,问该批产品能否出厂?若抽查结果发现1件次品,问能否厂?,为此提出如下假设:,例2 某厂生产的螺钉,按标准强度为68/mm2,而实际生产的强度X 服.若,则认为这批螺钉符合要求,否则认为不符合要求.现从整批螺钉中取容量为36的样本,其样本均值为68.5,问原假设是否正确?,为此提出如下假设:,在例1中,在例2中,均称为参数假设,参数假设一般是一对互逆的假设,比较参数的相等或大小,称其中的一个为原假设,也称零假设或基本假设,称另一个为备择假设,也称备选假设或对立假设,一般将含有等号的假设称为原假设,必须在原假设与备择假设 之间作一选择,在例1中,在例2中,均称为参数假设,参数假设一般是一对互逆的假设,比较参数的相等或大小,称其中的一个为原假设,也称零假设或基本假设,称另一个为备择假设,也称备选假设或对立假设,一般将含有等号的假设称为原假设,必须在原假设与备择假设 之间作一选择,二、假设检验的基本原理,假设检验的理论依据是“小概率原理”,小概率原理:如果一个事件发生的概率很小,那么在一次实验中,这个事件几乎不会发生.,事件“掷100枚均匀硬币全出现正面”,事件“某人随机买一注彩票中一等奖”,事件“在一副扑克中随机抽取4张全为A”,以上几个事件都可称为“小概率事件”,如:,无论原假设中是否含不等号,在实际检验时,均可按原假设仅含等号的检验进行检验.,例1 某产品出厂检验规定:次品率p不超过4%才能出厂.现从一万件产品中任意抽查12件发现3件次品,问该批产品能否出厂?若抽查结果发现1件次品,问能否厂?,解,假设,一万件产品中任意抽查12件发现3件次品是小概率事件,那么在一次实验中,这个事件几乎是不会发生的,现在竟然发生了,故认为原假设不成立,即该批产品次品率,则该批产品不能出厂.,例1 某产品出厂检验规定:次品率p不超过4%才能出厂.现从一万件产品中任意抽查12件发现3件次品,问该批产品能否出厂?若抽查结果发现1件次品,问能否厂?,解,假设,一万件产品中任意抽查12件发现3件次品是小概率事件,那么在一次实验中,这个事件几乎是不会发生的,现在竟然发生了,故认为原假设不成立,即该批产品次品率,则该批产品不能出厂.,这不是小概率事件,没理由拒绝原假设,从而接受原假设,即该批产品可以出厂.,若从一万件产品中任意抽查12件发现1件次品,例2 某厂生产的螺钉,按标准强度为68/mm2,而实际生产的强度X 服.若,则认为这批螺钉符合要求,否则认为不符合要求.现从整批螺钉中取容量为36的样本,其样本均值为68.5,问原假设是否正确?,解,假设,若原假设正确,则,因此,可以确定一个常数c 使得,反查正态分布表可得临界值,称区间(,66.82)与(69.18,+)为原假设的拒绝域,而区间(66.82,69.18)为原假设的接受域(实际上没理由拒绝)。,接受原假设,认为这批螺钉符合要求,均值 置信度为95%置信区间,例2 某厂生产的螺钉,按标准强度为68/mm2,而实际生产的强度X 服.若,则认为这批螺钉符合要求,否则认为不符合要求.现从整批螺钉中取容量为36的样本,其样本均值为68.5,问原假设是否正确?,解,假设,若原假设正确,则,因此,可以确定一个常数c 使得,查正态分布表可得临界值,称区间(,66.82)与(69.18,+)为原假设的拒绝域,而区间(66.82,69.18)为原假设的接受域(实际上没理由拒绝)。,接受原假设,认为这批螺钉符合要求,假设检验方法是 概率意义下的反证法.,要注意的是小概率事件毕竟不是不可能事件,只是小概率事件发生的概率很小,在一次实验中“几乎”不会发生.因此上述方法就可能出现错误,即真的假设被拒绝了,而错误的假设却可能被接受了.,1.第一类错误:弃真错误,此时我们便犯了“弃真”错误,也称为第一类错误,三、假设检验可能犯的两类错误,则犯弃真错误的概率为,小概率事件发生的概率就是犯弃真错误的概率,越大,犯第一类错误的概率越大,即越显著.,2.第二类错误:纳伪错误,此时我们便犯了“纳伪”错误,也称为第二类错误,犯纳伪错误的概率为,我们希望这两类错误都很小.但可以证明,在样本容量n固定时,同时减小 和是办不到的.当 减小时必导致 增大,反之亦然.要想使 和同时减小,只有增大样本容量n.,在实际应用中,一般原则是:在给定犯第一类错误的概率 之后,使得犯纳伪错误的概率尽可能的小.,在例2 中()计算犯第二类错误的概率,H0不真,即 68,可能小于68,也可能大于68,的大小取决于 的真值的大小.,若,例2 某厂生产的螺钉,按标准强度为68/mm2,而实际生产的强度X 服.若,则认为这批螺钉符合要求,否则认为不符合要求.现从整批螺钉中取容量为36的样本,其样本均值为68.5,问原假设是否正确?,区间(66.82,69.18)为原假设的接受域,在例2 中()计算犯第二类错误的概率,H0不真,即 68,可能小于68,也可能大于68,的大小取决于 的真值的大小.,若,若,的大小取决于 的真值的大小.,若,的大小取决于 的真值的大小.,仍取=0.05,得,因此,原假设的接受域为(67.118,68.882),现增大样本容量,取n=64,=66,则,原假设的接受域为(67.118,68.882),(一)根据问题的要求提出假设,写明原假设H0和备择假设H1的具体内容.,四、假设检验的一般步骤,(三)对给定(或选定)的显著性水平,由统计量的分布查表确定出临界值,进而得到H0的拒绝域和接受域.,(二)根据H0的内容,建立(或选取)检验统计量并确定其分布.,(四)由样本观察值计算出统计量的值.,(五)做出推断:当统计量的值满足“接受H0的条件”时就接受H0,否则就拒绝H0接受H1.,(六)完整准确地写出检验的结论.,8.2 单个正态总体的参数假设检验,一、方差已知的正态总体均值的检验,二、方差未知的正态总体均值的检验,三、大样本场合下,非正态总体均值的检验,四、单个正态总体方差的检验,一、方差已知的正态总体均值的检验,由抽样分布定理,构造小概率事件,双侧检验,例1 某百货商场的日营业额近似服从正态分布,去年的日平均营业额为53.6万元,均方差为6万元,今年随机抽查了10天的营业额,分是:58.2,57.8,58.4,59.3,60.7,71.3,56.4,58.9,48.5,49.5.根据经验认为方差没有变化.问今年的日平均营业额与去年相比是否有显著变化?,解,构造统计量,原假设的拒绝域为,原假设的拒绝域为,由样本观测值得,统计量观测值,查表得临界值,即认为今年的日平均营业额与去年有显著变化,统计量,构造小概率事件,单侧(边)检验,右侧(边)检验,上述方法称为,例2 某车间生产某种规格的钢丝,根据经验,其折断力,现改革了生产工艺,生产了一批钢丝,从中随机抽取一个n=10的样本,测得 千克,问新工艺是否值得推广?,解,构造统计量,原假设的拒绝域为,统计量观测值,即可以认为平均折断力有显著提高,故新工艺值得推广,查表得临界值,原假设的拒绝域为,统计量,构造小概率事件,左侧(边)检验,作业,P204 练习8.1,1.2.,P213 练习8.2,1.2.,二、方差未知的正态总体均值的检验,构造统计量,构造小概率事件,H0拒绝域,若统计量观测值,双侧检验,构造统计量,若统计量观测值,单侧检验,右侧检验,若统计量观测值,构造统计量,单侧检验,左侧检验,例3 用传统方法养鸡,经若干天后,鸡的平均重量为4斤,今改善饲养方法,经相同天数后,随机抽测10只,得数据如下:3.7,3.8,4.1,3.9,4.6,4.7,5.0,4.5,4.3,3.8斤,经验表明同一批鸡的重量近似服从正态分布,问改进饲养方法后的这批鸡的平均重量是否显著提高了?,解,构造统计量,原假设的拒绝域为,统计量观测值,即可以认为这批鸡的重量没有显著提高,由,查表得临界值,原假设的拒绝域为,三、大样本场合下,非正态总体均值的检验,构造统计量,构造统计量,四、单个正态总体方差的检验,由抽样分布定理,构造统计量,若小概率事件,发生,则,例4 正常生产知某维尼纶厂所产维尼纶的纤度近似服从正态分布,标准差为0.048,某日任意抽取20根测量其纤度的样本标准差为0.067,试判断该日产品的纤度波动是否有显著变化?,解,则,构造统计量,由,查表得临界值,统计量的观测值,即认为该日产品的纤度波动与以前有显著变化,构造统计量,构造统计量,应构造统计量,作业,P213 练习8.2,3.4.5.6.,8.3 两个正态总体的参数假设检验,参照单个正态总体的假设检验对两个正态总体的参数的假设进行检验,相互独立,由抽样分布定理,构造统计量,的观测值的绝对值应很小,因此原假设的拒绝域为,构造统计量,例1 甲、乙两厂生产的某种元件的寿命都近似服从正态分布,且相互独立,从两厂生产的元件中分别抽取了100只和75只,测得样本均值分别为1180小时和1220小时,问乙厂生产的元件平均寿命是否比甲厂高?,解,构造统计量,原假设的拒绝域为,由,查表得临界值,统计量观测值,即可以认为乙厂生产的元件寿命要比甲厂的高,由抽样分布定理,构造统计量,因此原假设的拒绝域为,构造统计量,例2 甲、乙两零件彼此可以替代,且它们的抗压强度都近似服从正态分布,但甲零件的成本较低,为评估质量,各抽取了5只,测得抗压强度数据如下:(kg/cm2)甲零件:89,89,90,84,88 乙零件:88,87,92,90,91假定它们抗压强度的方差相等,问能否认为甲零件的抗压强度不比乙零件低?,解,构造统计量,由,由样本观测值,得,查表得临界值,即可以认为甲零件的抗压强度不比乙零件低,由抽样分布定理,构造统计量,因此H0拒绝域为,H0拒绝域为,方差检验的双侧检验改为,构造统计量,简化的H0拒绝域,构造统计量,因此H0拒绝域为,H0拒绝域为,构造统计量,假设变为,例3 有两台机床生产同一型号的滚珠,测得直径近似服从正态分布,从这两台机床加工的产品中分别抽取了9个和7个,测得滚珠直径如下:(单位mm)甲机床:15,15.2,14.8,15.2,15,14.9,15.1,14.8,15.3乙机床:15.2,14.5,15.5,14.8,15.1,15.6,14.7问甲机床生产的产品是否更稳定(方差更小)?,解,构造统计量,由,由样本观测值,得,查表得临界值,统计量观测值为,即甲机床生产的产品比乙机床更稳定,例4 某灯泡厂在使用一项新工艺前后,各取10个灯泡进行寿命试验,计算得到相关数据如下:若灯泡寿命近似服从正态分布,问采用新工艺后的灯泡寿命是否显著提高?,解,两个总体的方差未知,而本题对总体均值的大小进行检验必须知道方差是否相等,故先检验方差的相等,构造统计量,H0拒绝域为,查表得临界值,统计量观测值为,构造统计量,H0拒绝域为,查表得临界值为,统计量观测值为,即可以认为采用新工艺后灯泡的平均寿命提高了,8.4 总体比率的假设检验,8.5 非参数假设检验,(略),(略),作业,P222 练习8.3,2.3.5.,