第三章假设检验(二)课件.ppt
食品试验设计Experiment Design of Food Research,主讲: 曹文红Speeches: Cao Wenhong广东海洋大学食品科技学院College of Food Science & Technology,GDOU,统计假设检验,主要讲授内容:1、统计假设检验的意义及基本原理2、统计假设检验的方法与步骤3、统计假设检验的几何意义与两类错误4、样本平均数的假设检验5、二项百分率的假设检验6、统计假设检验应注意的问题7、参数的区间估计,序言,许多科学研究都是从建立假说开始的。 天文学史上的日心说、宇宙发生史上的大爆炸说、地球形成史上的冷凝说、大陆形成史上的板块漂移说等,都是一些假说。假说是人们依据已获得的部分信息对客观世界的某种性状作出的推断性描述。假说既可能属真,也可以有误。假说在被提出之后,人们又进一步搜集信息,对假说的正确性进行验证。经过验证,或推翻假说或支持假说,真理就在这一过程中不断地被揭示、被发展,谬误也在这一过程中不断地被推翻、被纠正。统计假设检验的过程类似于这一证实或推翻假说、从而获取真理的过程。,科学研究的目的是获得总体的信息。而我们只能以来自总体的样本作为试验对象,在试验研究中,所获得的资料通常都是样本的结果,而我们希望了解的却是样本所在总体的情况。因此,还须从由样本到总体的方向来研究样本与总体的关系,即进行统计推断。所谓统计推断,就是根据抽样分布规律与概率理论,由样本结果去推论总体特征。主要包括假设检验和参数估计。,概括起来说,统计假设检验就是一种带有概率值保证的反证法。 反证法是大家熟悉的一种逻辑推理证明方法。有些命题从正面进行推论难以证明,但证明它的否命题却往往事半功倍,这就是反证法的思想方法。这样做的理由是从逻辑上说,否命题不成立,则其原命题就自然成立。反证法在数学证明中应用比较多。反证法的逻辑就是:证明了作为否命题的假设的错误,那么原命题就自然正确了。,统计假设检验从逻辑过程看也是一种反证法。统计检验人员常常希望证明备择假设是正确的,但他却不直接证明备择假设的正确性,而是从与备择假设对立的虚无假设出发,以虚无假设为条件,采集样本数据,确定抽样分布,计算检验统计量,考察检验计量取值的概率,如果最终发现这是一个小概率事件,那就要根据小概率事件原理推翻原虚无假设。当然,研究者必须保证在整个过程中除所作虚无假设之外的一切工作都是严密、科学的。虚无假设与备择假设是一对互否命题,也就是我们前面所说的他们是非此即彼的,推翻了虚无假设,备择假设就自然成立了。 这就是统计假设检验应用反证法的 “反证”过程。,所谓带有概率值保证是指上述的用反证的方法作的统计假设检验,最终推翻虚无假设也即由于所求检验统计量的取值为一小概率事件,而根据小概率事件原理推翻虚无假设。我们知道,根据小概率事件原理作决策判断是一种科学的正确的决策思想方法,但并不保证每次的决策都是正确。换句话说,这一推翻虚无假设的决策也是可能犯错误的,只是犯错误的概率比较小而决策正确的概率比较大,而且这个决策正确的概率是由我们控制,是可以计算的。这就是统计假设检验“带有概率值保证”的含义。,一、统计假设检验概述,1、统计假设检验的意义与基本原理,1.1、统计假设检验的意义,例:老工艺0= 48.2% 新工艺 =52.5%,这个差异到底是由什么造成的?采用新工艺?Or由抽样误差造成的?Or由这两个部分共同造成的?,叫做表面效应,统计学认为,仅由表面效应下结论是不正确的。因为我们不知道采用新工艺之后的总体平均数是否高于原总体平均数0。,处理效应,试验误差,统计假设检验正是这样一种运用抽样分布规律和概率理论,由从试验样本获得的表面效应去推断试验的处理效应是否真实存在的统计方法。,处理效应,试验误差,1.2 统计假设检验的基本原理,I、对研究的总体提出假设: H0:=0 (无效假设) HA: 0 (备择假设)II、在H0成立的条件下,构造合适的统计量,并由该统计量的抽样分布计算样本统计量的概率。 =0 ,所以表面效应 仅由误差造成,处理效应不存在。,可以看成是从 总体中随机抽取的一个样本平均数,服从,对其标准化,使之服从标准正态分布,III、根据估计出的统计量的概率的大小,作出接受或者否定无效假设的判断。 根据统计量的概率与显著性水平大小的关系作出接受或者否定无效假设的判断。 =0.05、=0.01,1.3 统计假设检验的步骤,(1)建立假设。(2)确定显著性水平。(3)检验计算统计量。构造一个统计量使 它服从标准正态分布或者是t分布。(4)统计推断。,1.4 统计假设检验的几何意义与两类错误,I、几何意义,在统计假设检验中,要在显著水平否定H0,必须|u|u,亦即u-u, uu。也就是,H0:= 0 被否定 ,这个区域叫否定域。,H0: = 0 被肯定 ,这个区域叫肯定域。,统计假设检验是根据小概率事件的不可能性原理来决定否定或肯定无效假设的。第一类错误:H0本身正确,但是通过假设检验却否定了它,也就是将非真实差异错判为真实差异.又叫错误。第二类错误:H0本身错误,但是通过假设检验却接受了它,也就是将真实差异错判为非真实差异.又叫错误。,II、统计假设检验的两类错误,两类错误示意图,减小第一类错误:缩小。减小第二类错误:减小均数标准误,两尾检验与一尾检验,二、样本平均数的假设检验,1、单个样本平均数的假设检验,检验某一样本平均数 与一已知总体平均数 是否有差异的方法,即,I、u检验法,条件:样本资料服从正态分布N(,2),且总体方差2已知。2未知,但样本平均数 来自一个大样本。例:书上,例:习题8,II、t检验,例:习题7(1)建立假设 H0:=0 (新工艺提取胡萝卜素与传统工艺无差异) HA: 0 (新工艺与旧工艺有差异) (2)确定显著性水平 =0.05(双尾检验),利用t分布来进行统计量的概率计算的假设检验方法。,(3)检验计算,自由度df=8-1=7,统计量t值:,(4)统计推断 查附表3 t0.05(7)=2.365 而|t|=1.6160.05 故应接受H0 说明新旧工艺的-胡萝卜素的提取率无显差异。,2、两个样本平均数的假设检验,两个样本平均数的假设检验,就是由两个样本平均数之差 去推断两个样本所在总体平均数1、2 是否有差异,也就是检验无效假设,和备择假设的问题。,I、成组资料平均数的假设检验,一个试验中若有两个处理,可将试验的全部单元完全随机地分成两组,各组的单元数可以相等也可以不相等。然后再对两组各自地实施一处理。由这样的实验中每个单元测得的一个观察值所组成的资料即为成组资料。,(1)u检验如果两个样本所在的总体为正态分布,且总体方差已知;或者总体方差未知,但两个样本都是大样本(n1、n230),可采用u检验。,在 下,正态离差u值为:,如果总体方差未知,但n1、n230,可由样本方差S12、S22估计总体方差12、22。,例:书上P78,服从具有自由度df=n1+n2-2的t分布,在H0:1=2 的条件之下,,(2)t检验当两个样本所在的总体方差12、22,又是小样本的时候,有,其中:,例:书上P80,II、成对资料平均数的假设检验,若试验设计是将条件、性质相同或相近的两个供试单元成一对,然后对每一配对的两个供试单元分别随机的给以不同的处理。从这种配对试验获得的数据叫做成对资料。成对资料中两个处理的数据不是相互独立的,而是存在着某种联系。,差数标准差为,差数平均数为,差数均数标准误为,服从自由度为df=n-1的t分布,在H0:1=2 的条件之下,d=0,自由度为n-1,根据该值取值概率的大小进行成对资料平均数的假设检验。,例: 某减肥保健食品进行检验减肥的效果,三、二项百分率的假设检验,在食品科学研究或生产实践中,有许多年试验结果都是用百分率来表示的。这些百分率都是由计数一个来自二项总体的样本中某一属性个体数目而求得的,即p=x/n。它实际上是由二项次数x转换成的百分率,其总体服从二项分布,所以叫二项百分率。,对二项百分率的假设检验,从理论上讲,应按二项分布进行,即由二项式(q+p)n的展开式中与样本百分率P对应项求出百分率的概率,再将此概率与显著性水平进行比较,从而做出统计推断。但是计算非常麻烦。当样本容量较大,P不过小,np和nq都不小于5时,二项分布接近于正态分布。因此,可以将二项百分率资料作正态处理,从而进行近似的u检验。,I、单个样本百分率的假设检验,在n30,np,nq 5时,有,标准化后,,在H0:p=p0下其中对u进行假设检验,例:习题12 p101,II、两个样本百分率的假设检验,由两个样本百分率 和 的差异去推断它们所在总体百分率P1和P2是否存在差异的方法。 在两个样本容量n1和n2均较大(30)n1p1,n1q1,n2p2,n2q2都大于5时,两个样本百分率的差数 服从正态分布。,在 下,则,其中:,在 下,由样本获得的两样本百分率的差数标准误差,III、二项百分率假设检验的连续性矫正,样本容量比较小,在n25, np5的时候必需进行连续性矫正 。,四、统计假设检验中应注意的问题,1、要有严密的试验设计和正确的试验技术2、选用的统计假设检验方法应符合其应用条件3、要正确理解差异显著性的统计意义4、合理建立假设,正确计算检验的统计量5、结论不能绝对化,五、参数的区间估计,总体平均数区间估计,两个总体平均数差数的区间估计,二项总体百分率p的区间估计,两个总体百分率差数的区间估计,The end!,