统计学第5章假设检验.ppt
第 6 章 假设检验,6.1 假设检验的基本问题 6.2 大样本情形下的总体均值检验6.3 小样本情形下的总体均值检验6.3 总体比例的检验,学习目标,假设检验的基本思想和原理 假设检验的步骤总体均值的检验总体比例的检验,6.1 假设检验的基本问题,原假设与备择假设拒绝域和检验统计量两类错误和显著性水平单侧检验与双侧检验,什么是假设检验,什么是假设?(hypothesis),对总体参数的具体数值所作的陈述总体参数包括总体均值、比例、方差等分析之前必需陈述,我认为这种新药的疗效比原有的药物更有效!,什么是假设检验?(hypothesis test),先对总体的参数提出某种假设,然后利用样本信息判断假设是否成立的过程有参数检验和非参数检验逻辑上运用反证法,统计上依据小概率原理,区间估计是用给定的大概率推断出总体参数的范围,而假设检验是以小概率为标准,对总体的状况所做出的假设进行判断。假设检验与区间估计结合起来,构成完整的统计推断内容。,假设检验与区间估计的差别主要在于:,假设检验的基本思想,.因此我们拒绝假设=50,样本均值,m,=50,抽样分布,H0,假设检验的过程,例1:消费者协会接到消费者投诉,指控品牌纸包装饮料存在容量不足,有欺骗消费者之嫌。包装上标明的容量为250毫升。消费者协会从市场上随机抽取50盒该品牌纸包装饮品,测试发现平均含量为248毫升,小于250毫升。这是生产中正常的波动,还是厂商的有意行为?消费者协会能否根据该样本数据,判定饮料厂商欺骗了消费者呢?,消费者协会实际要进行的是一项统计检验工作。检验总体平均=250是否成立。这就是一个原假设(null hypothesis),通常用 表示。,原假设与备择假设,原假设(null hypothesis),研究者想收集证据予以反对的假设又称“0假设”表示为 H0H0:指定为符号=,或,例如,H0:10cm,研究者想收集证据予以支持的假设也称“研究假设”表示为 H1H1:某一数值,或某一数值例如,H1:10cm,或 10cm,备择假设(alternative hypothesis),提出假设(例),原假设和备择假设是一个完备事件组,而且相互对立在一项假设检验中,原假设和备择假设必有一个成立,而且只有一个成立先确定备择假设,再确定原假设 等号“=”总是放在原假设上 因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论),提出假设(结论与建议),备择假设没有特定的方向性,并含有符号“”的假设检验,称为双侧检验或双尾检验(two-tailed test)备择假设具有特定的方向性,并含有符号“”或“”,称为右侧检验,双侧检验与单侧检验,双侧检验与单侧检验(假设的形式),两类错误与显著性水平,假设检验中的两类错误,1.第类错误(弃真错误)原假设为真时拒绝原假设第类错误的概率记为被称为显著性水平2.第类错误(取伪错误)原假设为假时未拒绝原假设第类错误的概率记为(Beta),H0:无罪,假设检验中的两类错误(决策结果),假设检验就好像一场审判过程,统计检验过程,错误和 错误的关系,影响 错误的因素,1.总体参数的真值随着假设的总体参数的减少而增大2.显著性水平 当 减少时增大3.总体标准差 当 增大时增大4.样本容量 n当 n 减少时增大,显著性水平(significant level),1.是一个概率值2.原假设为真时,拒绝原假设的概率被称为抽样分布的拒绝域3.表示为(alpha)常用的 值有0.01,0.05,0.104.由研究者事先确定,假设检验中的小概率原理,什么小概率?1.在一次试验中,一个几乎不可能发生的事件发生的概率2.在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设3.小概率由研究者事先确定,统计量与拒绝域,构造一个统计量来决定是否拒绝原假设。对不同的问题,要选择不同的检验统计量。,根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量对样本估计量的标准化结果原假设H0为真点估计量的抽样分布,检验统计量(test statistic),标准化的检验统计量,检验统计量确定后,就要利用该统计量的分布以及由实际问题中所确定的显著性水平,来进一步确定检验统计量拒绝原假设的取值范围,即拒绝域。在给定的显著性水平下,检验统计量的可能取值范围被分成两部分:小概率区域与大概率区域。小概率区域就是概率不超过显著性水平的区域,是原假设的拒绝区域;大概率区域是概率为1-的区域,是原假设的接受区域。,单侧检验与双侧检验,双侧检验,左侧检验,右侧检验,显著性水平和拒绝域(双侧检验),抽样分布,显著性水平和拒绝域(双侧检验),显著性水平和拒绝域(双侧检验),显著性水平和拒绝域(双侧检验),显著性水平和拒绝域(单侧检验),显著性水平和拒绝域(左侧检验),显著性水平和拒绝域(左侧检验),显著性水平和拒绝域(右侧检验),显著性水平和拒绝域(右侧检验),决策规则,双侧检验:I统计量I 临界值,拒绝H0左侧检验:统计量 临界值,拒绝H0,假设检验结论的表述,假设检验结论的表述,假设检验的目的就在于试图找到拒绝原假设,而不在于证明什么是正确的拒绝原假设时结论是清楚的例如,H0:=10,拒绝H0时,我们可以说10当不拒绝原假设时并未给出明确的结论不能说原假设是正确的,也不能说它不是正确的例如,当不拒绝H0:=10,我们并未说它就是10,但也未说它不是10。我们只能说样本提供的证据还不足以推翻原假设,假设检验步骤的总结,陈述原假设和备择假设从所研究的总体中抽出一个随机样本确定一个适当的检验统计量,并利用样本数据算出其具体数值确定一个适当的显著性水平,并计算出其临界值,指定拒绝域将统计量的值与临界值进行比较,作出决策统计量的值落在拒绝域,拒绝H0,否则不拒绝H0也可以直接利用P值作出决策,6.2 总体均值的检验,大样本情形下总体均值的检验小样本情形下总体均值的检验,总体均值的检验(大样本),例1:消费者协会接到消费者投诉,指控品牌纸包装饮料存在容量不足,有欺骗消费者之嫌。包装上标明的容量为250毫升。消费者协会从市场上随机抽取50盒该品牌纸包装饮品,测试发现平均含量为248毫升,小于250毫升。这是生产中正常的波动,还是厂商的有意行为?消费者协会能否根据该样本数据,判定饮料厂商欺骗了消费者呢?,在例1中,按历史资料,总体的标准差是4毫升。我们通过检验总体均值是否等于250毫升,来判断饮料厂商是否欺骗了消费者。程序如下:,第一步:确定原假设与备选假设。,:=250;:250以上的备选假设是总体均值小于250毫升,因为消费者协会希望通过样本数据推断出厂商的欺骗行为(大于250毫升一般不会发生)。因此使用左侧检验。,第二步:构造出检验统计量,如果总体的标准差已知,则正态总体(正常情况下,生产饮料的容量服从正态分布)的抽样平均数,也服从正态分布,对它进行标准化变换,可得到:可用z作为检验统计量。,第三步:确定显著性水平、拒绝域。,通常显著水平由实际问题确定,我们这里取=0.05,左侧检验,拒绝域安排在左边,查标准正态分布表得临界值:-=-1.645,拒绝域是z-1.645。,第四步:计算检验统计量的数值。,样本平均数,n=50,代入检验统计量得:,第五步:判断。,检验统计量的样本取值落入拒绝域。拒绝原假设,接受备选假设,认为有足够的证据说明该种纸包饮料的平均容量小于包装盒上注明的250毫升,厂商有欺诈之嫌。,总体标准差未知时对总体均值检验经常用t统计量:但是,在大样本场合(样本容量n大于30时),t-统计量与标准正态分布统计量近似,通常用z检验代替t检验。,总体均值的检验(大样本),1.假定条件正态总体或非正态总体大样本(n30)使用z检验统计量 2 已知:2 未知:,总体均值的检验(大样本检验方法的总结),总体均值的检验(小样本),总体均值的检验(小样本),1.假定条件总体服从正态分布小样本(n 30)检验统计量 2 已知:2 未知:,总体均值的检验(小样本检验方法的总结),注:已知的拒绝域同大样本,6.2 总体比例的检验,总体比例检验,假定条件总体服从二项分布可用正态分布来近似(大样本)检验的 z 统计量,0为假设的总体比例,总体比例的检验(检验方法的总结),总体比例的检验(例题分析),【例】一种以休闲和娱乐为主题的杂志,声称其读者群中有80%为女性。为验证这一说法是否属实,某研究部门抽取了由200人组成的一个随机样本,发现有146个女性经常阅读该杂志。分别取显著性水平=0.05和=0.01,检验该杂志读者群中女性的比例是否为80%?它们的值各是多少?,双侧检验,总体比例的检验(例题分析),H0:=80%H1:80%=0.05n=200临界值(c):,检验统计量:,拒绝H0,该杂志的说法并不属实,决策:,结论:,总体比例的检验(例题分析),H0:=80%H1:80%=0.01n=200临界值(c):,检验统计量:,不拒绝H0,样本提供的证据还不足以推翻“该杂志声称读者群中有80%为女性”的看法,决策:,结论:,例2:,某企业声明有30%以上的消费者对其产品质量满意。如果随机调查600名消费者,表示对该企业产品满意的有220人。试在显著性水平=0.05下,检验调查结果是否支持企业的自我声明。,第一步:作出假设,解:。:=30%,:30%。以上的备选假设是企业自我声明的结论,我们希望该企业说的是实话。因此使用右侧检验。,第二步:构造z检验统计量。第三步:确定拒绝域。显著水平=0.05,查标准正态分布表得临界值:=1.645,拒绝域是z1.645。,第四步:计算检验统计量的数值。样本成数p=220/600=0.37,总体假设的成数=0.3,代入z检验统计量得:,第五步:判断。检验统计量的样本取值z=3.51.645,落入拒绝域。拒绝原假设,认为样本数据证明该企业声明属实。,p-值检验,p-值检验就是通过计算p-值,再将它与显著性水平作比较,决定拒绝还是接受原假设。所谓p-值就是拒绝原假设所需的最低显著性水平。p-值判断的原则是:如果p-值小于给定的显著性水平,则拒绝原假设;否则,接受原假设。或者,更直观来说就是:如果p-值很小,拒绝原假设,p-值很大,不拒绝原假设。请大家注意的是这里的p-值是指概率。,z检验的p-值:,检验统计量为z统计量的p-值计算公式,表示检验统计量的抽样数据,则p-值为:如果:,p值=2 如果:,p值=如果:,p值=,例3:利用p-值检验重新检验例1。,解:第一、第二步与例1完全相同,故省略之。第三步:计算样本统计的数值。样本平均数,n=50,代入检验统计量得:,第四步:计算p-值。使用左侧检验,p-值=。查标准正态分布表得:p-值=1-F(3.54)=(1-0.999 8)=0.000 2,第五步:判断。p-值小于给出的显著性水平(0.05),拒绝原假设,接受备选假设,与例1的结论相同。,本章小节,假设检验的基本问题 总体均值的检验总体比例的检验,