假设检验(完整版) PPT课件.ppt
《假设检验(完整版) PPT课件.ppt》由会员分享,可在线阅读,更多相关《假设检验(完整版) PPT课件.ppt(106页珍藏版)》请在三一办公上搜索。
1、统计假设检验,假设检验,第一节、假设检验概述第二节、总体平均数的假设检验(Z 、 T)第三节、总体比率的假设检验(P)第四节、总体方差的假设检验(卡方、F),第一节 假设检验概述,1、假设检验的基本思想2、假设检验的步骤3、两类错误和假设检验的规则,Ronald Aylmer Fisher,英国著名的统计学家,遗传学家,现代数理统计的奠基人之一。 他在抽样分布理论、相关回归分析、多元统计分析、最大似然估计理论,方差分析和假设检验有很多的建树。,女士品茶,20世纪20年代后期在英国剑桥一个夏日的下午,一群大学的绅士和他们的夫人以及来访者,正围坐在户外的桌旁享用下午的奶茶。奶茶一般是由牛奶和茶混合
2、而成的,调制时候可以先倒茶后倒牛奶,也可以先倒牛奶后倒茶。这时候,一名女士说她能区分这两种不同做法的调制出来的奶茶。那么如何检验这位女士的说法?为此Fisher进行了研究,从而提出了假设检验的思想。,1、推广素质教育以后,教学效果是不是有所提高?(教育统计)2、某种新胃药是否比以前更有效?(卫生统计)3、醉酒驾车认定为刑事犯罪后是否交通事故会减少?(司法统计)4、如何检测某批种子的发芽率?(农业统计)5、海关工作人员如何判定某批产品能够通关?(海关统计)6、红楼梦后40回作者的鉴定(文学统计)。7、民间借贷的利率为多少?(金融统计)8、兴奋剂检测(体育统计),假设检验的应用,1、假设检验的基本
3、思想 为研究某山区的成年男子的脉搏均数是否高于一般成年男子脉搏均数,某医生在一山区随机抽查了25名健康成年男子,得其脉搏均数x为74.2次/分,标准差为6.0次/分。根据大量调查已知一般健康成年男子脉搏均数为72次/分,能否据此认为该山区成年的脉搏均数高于一般成年男子的脉搏均数0? 问题1:造成这25名男子脉搏均数高于一般男子的原因是什么?,问题2、怎样判断以上哪个原因是成立的? 若x与0接近,其差别可用抽样误差解释,x来自于0 ; 若x与0相差甚远,其差别不宜用抽样误差解释,则怀疑x不属于0 。,由资料已知样本均数与总体均数不等,原因有二: (1)两者非同一总体,即两者差异由地理气候等因素造
4、成,也就是可以说高山成年人的脉搏比一般人的要高; (2)两者为同一总体,即两者差异由抽样误差造成。,检验如下假设:原假设:高山成年人脉搏与一般人的脉搏没有差异:= 0备择假设:高山成年人脉搏与一般人的脉搏有差异: 0,假设检验的基本概念,概念事先对总体参数或分布形式作出某种假设然后利用样本信息来以一定的概率判断原假设是否成立参数检验和非参数检验(第8章的内容)作用一般是对有差异的数据进行检验,判断差异是否显著(概率)如果通过了检验,不能拒绝原假设,说明没有显著差异,那么这种差异是由抽样造成的如果不能通过检验,则拒绝原假设,说明有显著差异,这种差异是由系统误差造成的.证伪不能存真.,第一节 假设
5、检验概述,1、假设检验的基本思想2、假设检验的步骤3、两类错误和假设检验的规则,二、假设检验的步骤,1、根据具体的问题,建立原假设和备择假设2、构造一个合适的统计量,计算其抽样分布 (均值检验)3、给定显著水平和确定临界值 。 显著水平通常取0.1、0.05或0.01。在确定了显著水平后,根据统计量的分布就可以确定找出接受区域和拒绝区域的临界值。4、根据样本的值计算统计量的数值并作出决策。如果统计量的值落在拒绝域中,那么就没有通过检验,说明有显著差异,拒绝原假设。如果统计量的值落在接受域中,通过了假设检验,说明这种差异是由于抽样造成,这个样本不能拒绝原假设。,1、原假设与备择假设,原假设(nu
6、ll hypothesis) :一般研究者想收集证据予以反对的假设。表示为H0备择假设(alternative hypothesis):一般研究者想收集证据予以支持的假设。表示为H1由于假设检验中只有在小概率事件发生的情况下才拒绝原假设,因此在假设检验过程中是保护原假设的。,有三种形式:(1)双侧检验 H0: 0,H1: 0(不等,有差异);(2)左侧检验 H0: 0 , H1 : 0 (提高,增加)采用哪种形式要根据实际问题。,某种饮料的易拉罐瓶的标准容量为335毫升,为对生产过程进行控制,质量监测人员定期对某个分厂进行检查,确定这个分厂生产的易拉罐是否符合标准要求。如果易拉罐的平均容量大于
7、或小于335毫升,则表明生产过程不正常。试陈述用来检验生产过程是否正常的原假设和备择假设,解:研究者想收集证据予以证明的假设应该是“生产过程不正常”。建立的原假设和备择假设为 H0 : 335ml H1 : 335ml,消费者协会接到消费者投诉,指控品牌纸包装饮料存在容量不足,有欺骗消费者之嫌。包装上标明的容量为250毫升。消费者协会从市场上随机抽取50盒该品牌纸包装饮品进行假设检验。试陈述此假设检验中的原假设和备择假设。,解:消费者协会的意图是倾向于证实饮料厂包装饮料小于250ml 。建立的原假设和备择假设为 H0 : 250ml H1 : 250ml,【例】一家研究机构估计,某城市中家庭购
8、买有价证券的比率超过30%。为验证这一估计是否正确,该研究机构随机抽取了一个50户组成的样本进行检验,试陈述此问题中的原假设和备择假设。,解:研究者想收集证据予以支持的假设是“城市中家庭购买有价证券的比率超过30% ”。建立的原假设和备择假设为 H0 : 30% H1 : 30%,根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量,2、设计检验统计量,2、 标准化的检验统计量,非正态小样本情形不讨论。,3、拒绝域和接受域的确定(双侧检验 ),抽样分布,0,临界值,临界值,a/2,a/2,样本统计量,拒绝H0,拒绝H0,1 - ,置信水平,拒绝域,接受域,拒绝域,4、判
9、断规则从概率的角度来讲,如果统计量取值的概率小于或者等于显著水平,表明小概率事件发生了,因此拒绝原假设,反之,不能拒绝原假设。(p值*)如果统计量的值正好落在拒绝域之内,那么拒绝原假设,如果落在接受域之内,则不能拒绝原假设,如果正好等于临界值,也要拒绝原假设。,【例1】一种罐装饮料采用自动生产线生产,每罐的容量是255ml,标准差为5ml,服从正态分布。为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了16罐进行检验,测得每罐平均容量为257.2ml。取显著性水平=0.05 ,检验该天生产的饮料容量是否符合标准要求?,双侧检验,H0 : = 255H1 : 255 = 0.05n
10、 = 16临界值(Zc):,检验统计量:,决策:不能拒绝H0,结论:样本提供的证据表明:该天生产的饮料与标准没有显著差异,样本均值与标准的差异是因为随机因素所引起的。,总 体(某种假设),抽样,样 本(观察结果),检验,(不能拒绝原假设),(拒绝原假设),小概率事件未 发 生,小概率事件发 生,3.做法采用逻辑上的反证法依据统计上的小概率原理(核心是构造小概率事件),假设检验中的反证法与数学中的反证法的比较,小概率事件在一次实验中不可能发生的事件,如果发生了,那么就可以拒绝原来的假设。泰力布:等待黑天鹅的人,显著性水平和拒绝域(单侧检验 ),拒绝域,接受域,显著性水平和拒绝域(左侧检验 ),显
11、著性水平和拒绝域(左侧检验 ),观察到的样本统计量,【例2】一种罐装饮料采用自动生产线生产,每罐的容量是255ml,标准差为5ml,服从正态分布。换了一批工人后,质检人员在某天生产的饮料中随机抽取了16罐进行检验,测得每罐平均容量为257.2ml。取显著性水平=0.05 ,检验该天生产的饮料容量是否增加了?,右侧检验,H0 : 255 H1 : 255,决策:拒绝H0,结论:样本提供的证据表明:该天生产的饮料与标准有显著差异,可以认为换工人后容量增加了。,显著性水平和拒绝域(右侧检验 ),显著性水平和拒绝域(右侧检验 ),第一节 假设检验概述,1、假设检验的基本思想2、假设检验的步骤3、两类错
12、误和假设检验的规则,三、两类错误和假设检验的规则,1.第类错误(弃真错误)原假设为真时拒绝原假设第类错误的概率记为被称为显著性水平2.第类错误(取伪错误)原假设为假时未拒绝原假设第类错误的概率记为(Beta),H0: 无罪,假设检验中的两类错误,假设检验就好像一场审判过程,统计检验过程,H0: 药品为真药,假设检验中的两类错误之间的关系,宁可错杀三千,不可放过一个。,H0: 某次面试为好机会, 错误和 错误的关系,你不能同时减少两类错误!只能增加样本容量。,和 的关系就像翘翘板,小 就大, 大 就小,四、置信区间与假设检验之间的关系1、根据置信度1- 构造置信区间,如果统计量落在置信区间中,那
13、么接受原假设,如果不在置信区间中,那么拒绝原假设。2、根据显著水平 ,可以构建置信度为1- 的置信区间。,一个总体的检验,第二节 总体均值的检验一、单个总体均值的检验(Z T)二、两个总体均值检验(等方差、异方差)三、两个非正态总体均值之差的检验(成对检验),一、单个正态总体均值的检验,确定检验统计量的因素: 1、样本容量的大小 2、总体分布形状 3、总体方差是否已知主要情形(6种)正态总体(方差未知,且为小样本,1种)正态总体(方差已知,小样本,1种)大样本(不论总体是否正态,不论方差是否已知,4种)三种假设检验的形式(双侧,左侧和右侧),(一)总体平均数的检验(小样本,正态,方差已知),1
14、. 假定条件总体服从正态分布小样本(n 30),但是总体方差已知检验统计量,某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为0=0.081mm,总体标准差为= 0.025 。今换一种新机床进行加工,抽取n=200个零件进行检验,得到的椭圆度为0.076mm。试问新机床加工零件的椭圆度的均值与以前有无显著差异?(0.05),H0: = 0.081,H1: 0.081, = 0.05,n = 200临界值(s)(双侧检验),检验统计量:,决策:拒绝H0,结论: 有证据表明新机床加工的零件的椭圆度与以前有显著差异。,均值的单侧 Z 检验,根据过去大量资料,某厂生
15、产的灯泡的使用寿命服从正态分布N(1020,1002)。现从最近生产的一批产品中随机抽取16只,测得样本平均寿命为1080小时。试在0.05的显著性水平下判断这批产品的使用寿命是否有显著提高?(0.05),右侧检验,H0 : 1020 H1 : 1020,决策:在 0.05的水平上拒绝H0,结论:样本提供的证据表明:该天生产的饮料与标准有显著差异,可以认为试用寿命提高了。,总体均值的检验(z检验) (P 值的计算与应用),第1步:进入Excel表格界面,直接点击“f(x)”(粘贴 函数)第2步:在函数分类中点击“统计”,并在函数名的 菜单下选择“NORMSDIST”,然后确定第3步:将 z 的
16、绝对值2.4录入,得到的函数值为 0.9918 P值= 1-0.9918= 0.0082 P值小于,故拒绝H0,总体均值的检验(z检验) (P 值的图示),【例3】一种罐装饮料采用自动生产线生产,每罐的容量是255ml,标准差为5ml,服从正态分布。换了一批工人后,质检人员在某天生产的饮料中随机抽取了16罐进行检验,测得每罐平均容量为252.8ml。取显著性水平=0.05 ,检验该天生产的饮料容量是否减少了?,左侧检验,H0 : 255 H1 : 255,决策:在0.05水平上拒绝H0,结论:样本提供的证据表明:该天生产的饮料与标准有显著差异,可以认为换工人后容量减少了。,总体均值的检验(z检
17、验) (P 值的计算与应用),第1步:进入Excel表格界面,直接点击“f(x)”(粘贴 函数)第2步:在函数分类中点击“统计”,并在函数名的 菜单下选择“NORMSDIST”,然后确定第3步:将 z 的绝对值-1.76录入,得到的函数值为 0.039204 P值= 0.039204 P值小于,故拒绝H0,总体均值的检验(z检验) (P 值的图示),总体均值的检验规则 (正态,小样本,方差已知),练习一,(二)总体平均数检验(小样本,正态,方差未知*),1. 假定条件总体服从正态分布小样本(n 30),但总体方差未知检验统计量,总体均值的检验规则 (正态,方差未知,小样本情形),【例1】某机器
18、制造的肥皂厚度规定为5cm,假设肥皂厚度服从正态分布。今欲了解机器性能是否良好,取16块肥皂为样本,测得平均厚度为5.2cm,标准差为0.4cm。问在显著水平为0.05的水平下,机器是否为良好?,双侧检验,H0 : = 5 H1 : 5,决策:不能拒绝H0,结论:认为该机器还是良好的,没有充分的理由拒绝原假设。,【例2】某机器制造的肥皂厚度规定为5cm,假设肥皂厚度服从正态分布。今欲了解机器性能是否良好,取16块肥皂为样本,测得平均厚度为5.2cm,标准差为0.4cm。问在显著水平为0.05的水平下,肥皂的平均厚度是否偏高?,右侧检验,H0 : 5 H1 : 5,决策:拒绝H0,结论:认为肥皂
19、的平均厚度偏高。,P值=0.0319725%,拒绝。,一种汽车配件的平均长度要求为12cm,高于或低于该标准均被认为是不合格的。汽车生产企业在购进配件时,通常是经过招标,然后对中标的配件提供商提供的样品进行检验,以决定是否购进。现对一个配件提供商提供的10个样本进行了检验。假定该供货商生产的配件长度服从正态分布,在0.05的显著性水平下,检验该供货商提供的配件是否符合要求?,双侧检验:H0 : = 12 H1 : 12, = 0.05,df = 10 -1 = 9,决策:不拒绝H0,结论:该供货商提供的零件符合要求,总体均值的检验( t 检验) (P 值的计算与应用),第1步:进入Excel表
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 假设检验完整版 PPT课件 假设检验 完整版 PPT 课件
链接地址:https://www.31ppt.com/p-1457893.html