第八章假设检验 第1讲ppt课件.ppt
《第八章假设检验 第1讲ppt课件.ppt》由会员分享,可在线阅读,更多相关《第八章假设检验 第1讲ppt课件.ppt(99页珍藏版)》请在三一办公上搜索。
1、1,概率论与数理统计,福建师范大学福清分校数计系,2,第八章 假设检验,第1讲,3,假设检验的基本概念,若对参数有所了解,但有怀疑猜测需要证实之时,用假设检验的方法来 处理,4,假设检验是指施加于一个或多个总体的概率分布或参数的假设. 所作假设可以是正确的,也可以是错误的.,为判断所作的假设是否正确, 从总体中抽取样本,根据样本的取值,按一定原则进行检验, 然后作出接受或拒绝所作假设的决定.,5,假设检验所以可行,其理论背景为实际推断原理,即“小概率原理”,6,引例,某产品出厂检验规定: 次品率p不超过4%才能出厂. 现从一万件产品中任意抽查12件发现3件次品, 问该批产品能否出厂?若抽查结果
2、发现1件次品, 问能否出厂?,解 假设,这是 小概率事件 , 一般在一次试验中是不会发生的, 现一次试验竟然发生, 故认为原假设不成立, 即该批产品次品率 , 则该批产品不能出厂.,7,这不是小概率事件,没理由拒绝原假设,从而接受原假设, 即该批产品可以出厂.,若不用假设检验, 按理不能出厂.,注1,直接算,注2,本检验方法是 概率意义下的反证法,故拒绝原假设是有说服力的, 而接受原假设是没有说服力的. 因此应把希望否定的假设作为原假设.,8,对总体 提出假设,要求利用样本观察值,对提供的信息作出接受 (可出厂) , 还是接受 (不准出厂) 的判断.,9,1 假设检验,10,统计推断的另一类重
3、要问题是假设检验问题. 在总体的分布函数完全未知或只知其形式, 但不知道参数的情况, 为了推断总体的某些未知特性, 提出某些关于总体的假设. 例如, 提出总体服从泊松分布的假设, 又如, 对正态总体提出数学期望等于m0的假设等. 我们是要根据样本对所提出的假设作出是接受, 还是拒绝的决策. 假设检验是作出这一决策的过程.,11,例1 某车间用一台包装机包装葡萄糖. 包得的袋装糖重是一个随机变量, 它服从正态分布. 当机器正常时, 其均值为0.5公斤, 标准差为0.015公斤. 某日开工后为检验包装机是否正常, 随机地抽取它所包装的糖9袋, 称得净重为(公斤):0.497, 0.506, 0.5
4、18, 0.524, 0.498, 0.511, 0.520, 0.515, 0.512问机器是否正常?,12,以m,s分别表示这一天袋装糖重总体X的均值和标准差. 由于长期实践表明标准差比较稳定, 就设s=0.015. 于是XN(m,0.0152), 这里m未知. 问题是根据样本值来判断m=0.5还是m0.5. 为此, 我们提出两个相互对立的假设H0:m=m0=0.5和H1:m0.5.然后给一个合理的法则, 利用已知样本作出是接受假设H0, 还是接受假设H1. 如果接受H0, 则认为机器工作正常,否则不正常.,13,由于要检验的假设涉及总体均值m, 故首先想到是否可借助样本均值X这一统计量来
5、进行判断. X是m的无偏估计, 其观察值的大小在一定程度上反映m的大小. 如果假设H0为真, 则观察值x与m0的偏差|x-m0|一般不应太大. 若|x-m|过分大, 就怀疑假设H0的正确性而拒,14,因此, 可适当选定一正数k,使当观察值x满足,然而, 因为决策的依据是样本, 当实际上H0为真时仍可能做出拒绝H0的决策(这种可能性是无法消除的), 这是一种错误, 犯这种错误的概率记为,15,因无法排除犯这类错误的可能性, 因此自然希望将犯这类错误的概率控制在一定的限度之类. 即给出一个较小的数a(0a1), 使犯这类错误的概率不超过a, 即使得P当H0为真拒绝H0a.(1.1),犯这类错误的概
6、率最大为a, 令(1.1)式取等号,16,态分布分位点的定义得: k=za/2.,17,因而, 若Z的观察值满足,则拒绝H0, 而若,则接受H0,18,例如, 在本例中取a=0.05, 则有k=z0.05/2=z0.025=1.96, 又已知n=9, s=0.015, 再由样本算得x=0.511, 即有,于是拒绝H0, 认为这天包装机工作不正常.,19,上例中所采用的检验法则是符合实际推断原理的. 因通常a总是取得较小, 一般取a=0.01, 0.05. 因而若H0为真, 即当m=m0时,断原理, 就可以认为, 如果H0为真, 则由一次试验得到的观察值x, 满足不等式,了, 则我们有理由怀疑H
7、0为假, 拒绝H0.,20,上例中, 当样本容量固定时, 选定a后, 可确定,绝对值|z|大于等于k还是小于k来作出决策. 数k是检验上述假设的一个门槛值. 如果|z|k, 则称x与m0的差异是显著的, 这时拒绝H0; 反之, 如果|z|k, 则称x与m0的差异是不显著的, 这时接受H0. 数a称为显著性水平, 上面关于x与m0有无显著差异的判断是在显著性水平a之下作出的. 统计量Z称为检验统计量.,21,前面的检验问题常叙述成: 在显著性水平a下, 检验假设H0:m=m0, H1:mm0. (1.2)也常说成在显著性水平a下, 针对H1, 检验H0. H0称为原假设或零假设, H1称为备择假
8、设. 要进行的工作是, 根据样本, 按上述检验方法作出决策, 在H0与H1中择其一.当检验统计量取某个区域C中的值时, 我们拒绝原假设H0, 则C称为拒绝域, 拒绝域的边界点称为临界点, 如上例中拒绝域为|z|za/2, 而z=-za/2, z=za/2为临界点.,22,由于检验法则是根据样本作出的, 总有可能作出错误的决策. 如上面所说, 在假设H0实际上为真时, 可能犯拒绝H0的错误, 称这类弃真错误为第I类错误. 又当H0实际上不真时, 也有可能接受H0. 称这类取伪错误为第II类错误. 犯第II类错误的概率记为,23,一般来说, 当样本容量固定时, 若减少犯一类错误的概率, 则犯有另一
9、类错误的概率往往增大. 一般来说, 总是控制第I类错误的概率, 使它不大于a, a的大小视具体情况而定, 通常a取0.1, 0.05, 0.01, 0.005等值. 这种只对犯第I类错误的概率加以控制, 而不考虑犯第II类错误的概率的检验, 称为显著性检验.形如(1.2)式中的备择假设H1, 表示m1可能大于也可能小于m0, 称为双边备择假设, 而称形如(1.2)式的假设检验为双边假设检验.,24,有时只关心总体均值是否增大. 例如试验新工艺以提高材料的强度. 这时, 所考虑的总体的均值应该越大越好. 此时, 我们需要检验假设H0:mm0, H1:mm0. (1.3)形如(1.3)的假设检验,
10、 称为右边检验. 类似地, 有时需要检验假设H0:mm0,H1:mm0.(1.4)形如(1.4)的假设检验, 称为左边检验. 右边检验和左边检验统称为单边检验.,25,下面讨论单边检验的拒绝域.设总体XN(m,s2), s为已知, X1,X2,.,Xn是来自X的样本. 给定显著性水平a. 来求检验问题H0:mm0, H1:mm0(1.3)的拒绝域.因H0中的全部m都比H1中的m要小, 当H1为真时, 观察值x往往偏大, 因此, 拒绝域的形式为xk(k是某一正常数).,26,下面来确定常数k,令,27,28,29,类似地, 可得左边检验问题H0:mm0, H1:mm0(1.4)的拒绝域为,30,
11、例2 公司从生产商购买牛奶.公司怀疑生产商在牛奶中掺水以谋利.通过测定牛奶冰点,可以检验出牛奶是否掺水.天然牛奶的冰点温度近似服从正态分布,均值1= -0.545 oC,标准差=0.008 oC.牛奶掺水可使冰点温度升高而接近于水的冰点温度(0 oC).测得生产商提交的5批牛奶的冰点温度,其均值为 =-0.535 oC ,问是否可以认为生产商在牛奶中掺了水?取0.05,31,32,例3 某工厂生产的固体燃料推进器的燃烧率服从正态分布N(m,s2), m=40cm/s, s=2cm/s. 现在用新方法生产了一批推进器. 从中随机取n=25只, 测得燃烧率的样本均值为x=41.25cm/s. 设在
12、新方法下总体均方差仍为2cm/s, 问用新方法生产的推进器的燃烧率是否较以往生产的推进器的燃烧率有显著的提高? 取显著性水平a=0.05.,33,解 按题意需检验假设H0:mm0=40 (假设新方法没有提高燃烧率),H1:mm0 (假设新方法提高了燃烧率).这是右边检验问题, 其拒绝域如(1.6)式所示,z的值落在拒绝域中,所以在显著性水平a=0.05下拒绝H0, 认为新法的燃烧率有显著提高.,34,综上所述, 处理参数的假设检验问题步骤为:1. 根据实际问题的要求, 提出原假设H0及备择假设H1;2. 给定显著性水平a以及样本容量n;3. 确定检验统计量以及拒绝域的形式;4. 按P当H0为真
13、拒绝H0a求出拒绝域;5. 取样, 根据样本观察值作出决策, 是接受H0还是拒绝H0.,35,2 正态总体均值的假设检验,36,(一) 单个总体N(m,s2)均值m的检验1, s2已知, 关于m的检验(Z检验)在1中已讨论过正态总体N(m,s2)当s2已知时关于m的检验问题(1.2),(1.3),(1.4). 在这些检验问题中, 我们都是利用统计量,这种检验法常称为Z检验法.,37, 0, 0, 0, 0, 0, 0,Z检验法 (2 已知),38,2, s2未知, 关于m的检验(t检验)设总体XN(m,s2), 其中m,s2未知, 我们来求检验问题H0:m=m0,H1:mm0的拒绝域(显著性水
14、平为a).设X1,X2,.,Xn是来自总体X的样本, 由于s2未,到S2是s2的无偏估计, 我们用S来代替s, 采用,39,域的形式为,而当H0为真时,40,故由,得k=ta/2(n-1), 即得拒绝域为,对于正态总体N(m,s2), 当s2未知关于m的单边检验的拒绝域在书上表8.1中给出.上述利用 t 统计量的检验法称为t 检验法,41, 0, 0, 0, 0, 0, 0,T 检验法 (2 未知),42,例 某厂生产小型马达,说明书上写着:在正常负载下平均消耗电流不超过0.8 安培.,解 根据题意待检假设可设为,随机测试16台马达, 平均消耗电流为0.92安培,标准差为0.32安培.,设马达
15、所消耗的电流 服从正态分布, 取显著性水平为 = 0.05, 问根据此样本, 能否否定厂方的断言?,43,H0 : 0.8 ; H1 : 0.8, 未知, 选检验统计量:,代入得,故接受原假设 H0 , 即不能否定厂方断言., :,拒绝域为,落在拒绝域 外,将,44,解二 H0 : 0.8 ; H1 : 0.8,选用统计量,拒绝域,故接受原假设, 即否定厂方断言.,现,落在拒绝域 外, :,45,由上例可见: 对问题的提法不同(把哪个假设作为原假设),统计检验的结果也会不同.,上述两种解法的立场不同,因此得到不同的结论.,第一种假设是不轻易否定厂方的结论;,第二种假设是不轻易相信厂方的结论.,
16、46,为何用假设检验处理同一问题会得到截然相反的结果?,这里固然有把哪个假设作为原假设从而引起检验结果不同这一原因;除此外还有一个根本的原因,即样本容量不够大,若样本容量足够大,则不论把哪个假设作为原假设所得检验结果基本上应该是一样的否则假设检验便无意义了!,47,由于假设检验是控制犯第一类错误的概率, 使得拒绝原假设 H0 的决策变得比较慎重, 也就是 H0 得到特别的保护. 因而, 通常把有把握的, 经验的结论作为原假设, 或者尽量使后果严重的错误成为第一类错误.,48,例1 某种元件的寿命X(以小时计)服从正态分布N(m,s2), m, s2均未知. 现测得16只元件的寿命如下:159,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第八章假设检验 第1讲ppt课件 第八 假设检验 ppt 课件
链接地址:https://www.31ppt.com/p-1356955.html