统计学-假设检验概念和方法.ppt
第 6章 假设检验,1 假设检验的基本问题 2 一个正态总体参数的检验3 两个正态总体参数的检验4 假设检验中的其他问题,假设检验在统计方法中的地位,学习目标,了解假设检验的基本思想 掌握假设检验的步骤对实际问题作假设检验利用置信区间进行假设检验利用P-值进行假设检验,6.1 假设检验的基本问题,假设问题的提出假设的表达式两类错误假设检验中的值假设检验的另一种方法单侧检验,让我们先看一个例子.,基本概念,生产流水线上罐装可乐不断地封装,然后装箱外运.怎么知道这批罐装可乐的容量是否合格呢?,罐装可乐的容量按标准应为355毫升.,基本概念,每隔一定时间,抽查若干罐.,如每隔1小时,抽查5罐,得5个容量的值X1,X5,根据这些值来判断生产是否正常.,通常的办法是进行抽样检查.,基本概念,根据样本的信息检验关于总体的某个命题是否正确.,这类问题称作假设检验问题.,基本概念,什么是假设?(hypothesis),对总体参数的的数值所作的一种陈述总体参数包括总体均值、比例、方差等分析之前必需陈述,我认为该地区新生婴儿的平均体重为3190克!,什么是假设检验?(hypothesis testing),事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断原假设是否成立有参数假设检验和非参数假设检验采用逻辑上的反证法,依据统计上的小概率原理,假设检验的基本思想,.因此我们拒绝假设=50,样本均值,m,=50,抽样分布,H0,假设检验的过程,假设检验的步骤提出假设确定适当的检验统计量规定显著性水平计算检验统计量的值作出统计决策,提出原假设和备择假设,什么是原假设?(null hypothesis)待检验的假设,又称“0假设”研究者想收集证据予以反对的假设3.总是有等号,或4.表示为 H0H0:某一数值 指定为=号,即 或 例如,H0:3190(克),为什么叫0假设?,为什么叫 0 假设?,之所以用零来修饰原假设,其原因是原假设的内容总是没有差异或没有改变,或变量间没有关系等等零假设总是一个与总体参数有关的问题,所以总是用希腊字母表示。关于样本统计量如样本均值或样本均值之差的零假设是没有意义的,因为样本统计量是已知的,当然能说出它们等于几或是否相等,什么是备择假设?(alternative hypothesis)与原假设对立的假设,也称“研究假设”研究者想收集证据予以支持的假设总是有不等号:,或 表示为 H1H1:某一数值,或 某一数值例如,H1:3910(克),或 3910(克),提出原假设和备择假设,什么检验统计量?1.用于假设检验决策的统计量2.选择统计量的方法与参数估计相同,需考虑是大样本还是小样本总体方差已知还是未知检验统计量的基本形式为,确定适当的检验统计量,规定显著性水平(significant level),什么显著性水平?1.是一个概率值2.原假设为真时,拒绝原假设的概率被称为抽样分布的拒绝域3.表示为(alpha)常用的 值有0.01,0.05,0.104.由研究者事先确定,作出统计决策,计算检验的统计量根据给定的显著性水平,查表得出相应的临界值z或z/2,t或t/2将检验统计量的值与 水平的临界值进行比较得出拒绝或不拒绝原假设的结论,假设检验中的小概率原理,什么小概率?1.在一次试验中,一个几乎不可能发生的事件发生的概率2.在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设3.小概率由研究者事先确定,什么是小概率?,概率是从0到1之间的一个数,因此小概率就应该是接近0的一个数著名的英国统计家Ronald Fisher 把20分之1作为标准,这也就是0.05,从此0.05或比0.05小的概率都被认为是小概率Fisher没有任何深奥的理由解释他为什么选择0.05,只是说他忽然想起来的,假设检验中的两类错误,1.第一类错误(弃真错误)原假设为真时拒绝原假设会产生一系列后果第一类错误的概率为被称为显著性水平2.第二类错误(取伪错误)原假设为假时接受原假设第二类错误的概率为(Beta),H0:无罪,假设检验中的两类错误(决策结果),假设检验就好像一场审判过程,统计检验过程,错误和 错误的关系,影响 错误的因素,1.总体参数的真值随着假设的总体参数的减少而增大2.显著性水平 当 减少时增大3.总体标准差 当 增大时增大4.样本容量 n当 n 减少时增大,什么是P 值?(P-value),是一个概率值如果原假设为真,P-值是抽样分布中大于或小于样本统计量的概率左侧检验时,P-值为曲线上方小于等于检验统计量部分的面积右侧检验时,P-值为曲线上方大于等于检验统计量部分的面积被称为观察到的(或实测的)显著性水平H0 能被拒绝的的最小值,双侧检验的P 值,左侧检验的P 值,右侧检验的P 值,利用 P 值进行检验(决策准则),单侧检验若p-值,不拒绝 H0若p-值/2,不拒绝 H0若p-值/2,拒绝 H0,双侧检验与单侧检验(假设的形式),双侧检验(原假设与备择假设的确定),属于决策中的假设检验不论是拒绝H0还是不拒绝H0,都必需采取相应的行动措施例如,某种零件的尺寸,要求其平均长度为10cm,大于或小于10cm均属于不合格我们想要证明(检验)大于或小于这两种可能性中的任何一种是否成立建立的原假设与备择假设应为 H0:=10 H1:10,双侧检验(显著性水平与拒绝域),双侧检验(显著性水平与拒绝域),双侧检验(显著性水平与拒绝域),双侧检验(显著性水平与拒绝域),单侧检验(原假设与备择假设的确定),将研究者想收集证据予以支持的假设作为备择假设H1例如,一个研究者总是想证明自己的研究结论是正确的一个销售商总是想正确供货商的说法是不正确的备择假设的方向与想要证明其正确性的方向一致将研究者想收集证据证明其不正确的假设作为原假设H0先确立备择假设H1,单侧检验(原假设与备择假设的确定),一项研究表明,采用新技术生产后,将会使产品的使用寿命明显延长到1500小时以上。检验这一结论是否成立研究者总是想证明自己的研究结论(寿命延长)是正确的备择假设的方向为“”(寿命延长)建立的原假设与备择假设应为 H0:1500 H1:1500,单侧检验(原假设与备择假设的确定),一项研究表明,改进生产工艺后,会使产品的废品率降低到2%以下。检验这一结论是否成立研究者总是想证明自己的研究结论(废品率降低)是正确的备择假设的方向为“”(废品率降低)建立的原假设与备择假设应为 H0:2%H1:2%,单侧检验(原假设与备择假设的确定),某灯泡制造商声称,该企业所生产的灯泡的平均使用寿命在1000小时以上。如果你准备进一批货,怎样进行检验检验权在销售商一方作为销售商,你总是想收集证据证明生产商的说法(寿命在1000小时以上)是不是正确的备择假设的方向为“”(寿命不足1000小时)建立的原假设与备择假设应为 H0:1000 H1:1000,单侧检验(显著性水平与拒绝域),左侧检验(显著性水平与拒绝域),左侧检验(显著性水平与拒绝域),右侧检验(显著性水平与拒绝域),右侧检验(显著性水平与拒绝域),6.2 一个正态总体参数的检验,检验统计量的确定总体均值的检验总体比例的检验总体方差的检验,一个总体参数的检验,总体均值的检验(检验统计量),总体 是否已知?,总体均值的检验(2 已知或2未知大样本),1.假定条件总体服从正态分布若不服从正态分布,可用正态分布来近似(n30)使用Z-统计量2 已知:2 未知:,2 已知均值的检验(例题分析),【例】某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为0=0.081mm,总体标准差为=0.025。今换一种新机床进行加工,抽取n=200个零件进行检验,得到的椭圆度为0.076mm。试问新机床加工零件的椭圆度的均值与以前有无显著差异?(0.05),双侧检验,2 已知均值的检验(例题分析),H0:=0.081H1:0.081=0.05n=200临界值(s):,检验统计量:,决策:,结论:,在=0.05的水平上拒绝H0,有证据表明新机床加工的零件的椭圆度与以前有显著差异,2 已知均值的检验(P 值的计算与应用),第1步:进入Excel表格界面,选择“插入”下拉菜单第2步:选择“函数”点击第3步:在函数分类中点击“统计”,在函数名的菜 单下选择字符“NORMSDIST”然后确定第4步:将Z的绝对值2.83录入,得到的函数值为 0.997672537 P值=2(10.997672537)=0.004654 P值远远小于,故拒绝H0,2 已知均值的检验(小样本例题分析),【例】根据过去大量资料,某厂生产的灯泡的使用寿命服从正态分布N(1020,1002)。现从最近生产的一批产品中随机抽取16只,测得样本平均寿命为1080小时。试在0.05的显著性水平下判断这批产品的使用寿命是否有显著提高?(0.05),单侧检验,2 已知均值的检验(小样本例题分析),H0:1020H1:1020=0.05n=16临界值(s):,检验统计量:,在=0.05的水平上拒绝H0,有证据表明这批灯泡的使用寿命有显著提高,决策:,结论:,2 未知大样本均值的检验(例题分析),【例】某电子元件批量生产的质量标准为平均使用寿命1200小时。某厂宣称他们采用一种新工艺生产的元件质量大大超过规定标准。为了进行验证,随机抽取了100件作为样本,测得平均使用寿命1245小时,标准差300小时。能否说该厂生产的电子元件质量显著地高于规定标准?(0.05),单侧检验,2 未知大样本均值的检验(例题分析),H0:1200H1:1200=0.05n=100临界值(s):,检验统计量:,在=0.05的水平上不拒绝H0,不能认为该厂生产的元件寿命显著地高于1200小时,决策:,结论:,总体均值的检验(2未知小样本),1.假定条件总体为正态分布2未知,且小样本2.使用t 统计量,2 未知小样本均值的检验(例题分析),【例】某机器制造出的肥皂厚度为5cm,今欲了解机器性能是否良好,随机抽取10块肥皂为样本,测得平均厚度为5.3cm,标准差为0.3cm,试以0.05的显著性水平检验机器性能良好的假设。,双侧检验,2 未知小样本均值的检验(例题分析),H0:=5H1:5=0.05df=10-1=9临界值(s):,检验统计量:,在=0.05的水平上拒绝H0,说明该机器的性能不好,决策:,结论:,2 未知小样本均值的检验(P 值的计算与应用),第1步:进入Excel表格界面,选择“插入”下拉菜单第2步:选择“函数”点击,并在函数分类中点击“统 计”,然后,在函数名的菜单中选择字符“TDIST”,确定第3步:在弹出的X栏中录入计算出的t值3.16 在自由度(Deg-freedom)栏中录入9 在Tails栏中录入2,表明是双侧检验(单测 检验则在该栏内录入1)P值的结果为0.011550.025,拒绝H0,2 未知小样本均值的检验(例题分析),【例】一个汽车轮胎制造商声称,某一等级的轮胎的平均寿命在一定的汽车重量和正常行驶条件下大于40000公里,对一个由20个轮胎组成的随机样本作了试验,测得平均值为41000公里,标准差为5000公里。已知轮胎寿命的公里数服从正态分布,我们能否根据这些数据作出结论,该制造商的产品同他所说的标准相符?(=0.05),单侧检验!,均值的单尾 t 检验(计算结果),H0:40000H1:40000=0.05df=20-1=19临界值(s):,检验统计量:,在=0.05的水平上不拒绝H0,不能认为制造商的产品同他所说的标准不相符,决策:,结论:,总体比例的检验(Z 检验),适用的数据类型,一个总体比例检验,假定条件有两类结果总体服从二项分布可用正态分布来近似比例检验的 Z 统计量,0为假设的总体比例,一个总体比例的检验(例题分析),【例】一项统计结果声称,某市老年人口(年龄在65岁以上)的比重为14.7%,该市老年人口研究会为了检验该项统计是否可靠,随机抽选了400名居民,发现其中有57人年龄在65岁以上。调查结果是否支持该市老年人口比重为14.7%的看法?(=0.05),双侧检验,一个总体比例的检验(例题分析),H0:=14.7%H1:14.7%=0.05n=400临界值(s):,检验统计量:,在=0.05的水平上不拒绝H0,该市老年人口比重为14.7%,决策:,结论:,方差的卡方(2)检验,检验一个总体的方差或标准差假设总体近似服从正态分布检验统计量,方差的卡方(2)检验(例题分析),【例】某厂商生产出一种新型的饮料装瓶机器,按设计要求,该机器装一瓶一升(1000cm3)的饮料误差上下不超过1cm3。如果达到设计要求,表明机器的稳定性非常好。现从该机器装完的产品中随机抽取25瓶,分别进行测定(用样本减1000cm3),得到如下结果。检验该机器的性能是否达到设计要求(=0.05),双侧检验,方差的卡方(2)检验(例题分析),H0:2=1H1:2 1=0.05df=25-1=24临界值(s):,统计量:,在=0.05的水平上不拒绝H0,不能认为该机器的性能未达到设计要求,决策:,结论:,6.3 两个正态总体参数的检验,检验统计量的确定两个总体均值之差的检验两个总体比例之差的检验两个总体方差比的检验检验中的匹配样本,两个正态总体参数的检验,独立样本总体均值之差的检验,两个独立样本之差的抽样分布,两个总体均值之差的检验(12、22 已知),1.假定条件两个样本是独立的随机样本两个总体都是正态分布若不是正态分布,可以用正态分布来近似(n130和 n230)检验统计量为,两个总体均值之差的检验(假设的形式),两个总体均值之差的检验(例题分析),双侧检验!,【例】有两种方法可用于制造某种以抗拉强度为重要特征的产品。根据以往的资料得知,第一种方法生产出的产品其抗拉强度的标准差为8公斤,第二种方法的标准差为10公斤。从两种方法生产的产品中各抽取一个随机样本,样本容量分别为n1=32,n2=40,测得x2=50公斤,x1=44公斤。问这两种方法生产的产品平均抗拉强度是否有显著差别?(=0.05),两个总体均值之差的检验(例题分析),H0:1-2=0H1:1-2 0=0.05n1=32,n2=40临界值(s):,检验统计量:,决策:,结论:,在=0.05的水平上拒绝H0,有证据表明两种方法生产的产品其抗拉强度有显著差异,两个总体均值之差的检验(12、22 未知且不相等,小样本),检验具有不等方差的两个总体的均值假定条件两个样本是独立的随机样本两个总体都是正态分布两个总体方差未知且不相等12 22检验统计量,其中:,两个总体均值之差的检验(12、22 未知但相等,小样本),检验具有等方差的两个总体的均值假定条件两个样本是独立的随机样本两个总体都是正态分布两个总体方差未知但相等12=22检验统计量,两个总体均值之差的检验(例题分析),单侧检验,【例】“多吃谷物,将有助于减肥。”为了验证这个假设,随机抽取了35人,询问他们早餐和午餐的通常食谱,根据他们的食谱,将其分为二类,一类为经常的谷类食用者(总体1),一类为非经常谷类食用者(总体2)。然后测度每人午餐的大卡摄取量。经过一段时间的实验,得到如下结果:检验该假设(=0.05),两个总体均值之差的检验(例题分析用统计量进行检验),H0:1-2 0H1:1-2 0=0.05n1=15,n2=20临界值(s):,检验统计量:,决策:,结论:,在=0.05的水平上拒绝H0,没有证据表明多吃谷物将有助于减肥,两个总体均值之差的检验(例题分析用R进行检验),第1步:选择“工具”下拉菜单,并选择“数据分析”选项第2步:选择“t检验,双样本异方差假设”第3步:当出现对话框后 在“变量1的区域”方框内键入数据区域 在“变量2的区域”方框内键入数据区域 在“假设平均差”的方框内键入0 在“”框内键入0.05 在“输出选项”中选择输出区域 选择确定,用R进行检验,两个总体均值之差的检验(匹配样本的 t 检验),1.检验两个总体的均值配对或匹配重复测量(前/后)2.假定条件两个总体都服从正态分布如果不服从正态分布,可用正态分布来近似(n1 30,n2 30),匹配样本的 t 检验(假设的形式),注:Di=X1i-X2i,对第 i 对观察值,匹配样本的 t 检验(数据形式),匹配样本的 t 检验(检验统计量),样本差值均值,样本差值标准差,自由度df nD-1,统计量,D0:假设的差值,【例】一个以减肥为主要目标的健美俱乐部声称,参加其训练班至少可以使减肥者平均体重减重8.5kg以上。为了验证该宣称是否可信,调查人员随机抽取了10名参加者,得到他们的体重记录如下表:,匹配样本的 t 检验(例题分析),在=0.05的显著性水平下,调查结果是否支持该俱乐部的声称?,单侧检验,配对样本的 t 检验(例题分析),配对样本的 t 检验(例题分析),差值均值,差值标准差,H0:m1 m2 8.5H1:m1 m2 8.5a=0.05df=10-1=9临界值(s):,检验统计量:,决策:,结论:,在=0.05的水平上不拒绝H0,不能认为该俱乐部的宣称不可信,配对样本的 t 检验(例题分析),配对样本的 t 检验(例题分析用R进行检验),第1步:选择“工具”第2步:选择“数据分析”选项第3步:在分析工具中选择“t检验:平均值的成对二样本分析”第4步:当出现对话框后 在“变量1的区域”方框内键入数据区域 在“变量2的区域”方框内键入数据区域 在“假设平均差”方框内键入8.5 显著性水平保持默认值 用R进行检验,两个总体比例之差的检验,1.假定条件两个总体是独立的两个总体都服从二项分布可以用正态分布来近似检验统计量,两个总体比例之差的Z检验,两个总体比例之差的检验(假设的形式),两个总体比例之差的Z检验(例题分析),单侧检验,【例】对两个大型企业青年工人参加技术培训的情况进行调查,调查结果如下:甲厂:调查60人,18人参加技术培训。乙厂调查40人,14人参加技术培训。能否根据以上调查结果认为乙厂工人参加技术培训的人数比例高于甲厂?(=0.05),两个总体比例之差的Z检验(例题分析),H0:1-2 0H1:1-2 0=0.05n1=60,n2=40临界值(s):,检验统计量:,决策:,结论:,在=0.05的水平上不拒绝H0,没有证据表明乙厂工人参加技术培训的人数比例高于甲厂,两个总体方差比的检验(F 检验),假定条件两个总体都服从正态分布,且方差相等两个独立的随机样本假定形式H0:s12=s22 或 H0:s12 s22(或)H1:s12 s22 H1:s12)检验统计量F=S12/S22F(n1 1,n2 1),两个总体方差的 F 检验(临界值),两个总体方差的 F 检验(例题分析),H0:12=22 H1:12 22=0.05n1=15,n2=20临界值(s):,检验统计量:,决策:,结论:,在=0.05的水平上不拒绝H0,不能认为这两个总体的方差有显著差异,6.4 假设检验中的其他问题,用置信区间进行检验单侧检验中假设的建立,用置信区间进行检验(双侧检验),求出双侧检验均值的置信区间,2已知时:,2未知时:,若总体的假设值0在置信区间外,拒绝H0,用置信区间进行检验(单侧检验),左侧检验:求出单边置信下限,若总体的假设值0小于单边置信下限,拒绝H0右侧检验:求出单边置信上限,若总体的假设值0大于单边置信上限,拒绝H0,用置信区间进行检验(例题分析),【例】一种袋装食品每包的标准重量应为1000克。现从生产的一批产品中随机抽取16袋,测得其平均重量为991克。已知这种产品重量服从标准差为50克的正态分布。试确定这批产品的包装重量是否合格?(=0.05),双侧检验!,用置信区间进行检验(例题分析),H0:=1000H1:1000=0.05n=49临界值(s):,置信区间为,决策:,结论:,假设的0=1000在置信区间内,不拒绝H0,不能认为这批产品的包装重量不合格,本章小节,1.假设检验的概念和类型 2.假设检验的过程基于一个样本的假设检验问题4.基于两个样本的假设检验问题5.用置信区间进行检验6.利用p-值进行检验,