假设检验一般概念.ppt
假设检验是对总体的未知参数或总体服从的分布等,首先提出某种假设,例如假设未知参数为某一常数或总体服从某已知分布等,然后由样本提供的信息,对所做假设的“真实性”做出否定还是不否定,即拒绝还是接受的判定。假设检验问题分为如下两大类:参数假设检验:对总体中某个数字特征或分布中的参数提出假设检验(见8.1例)。非参数假设检验:对总体的分布、总体间的独立性以及是否同分布等方面的检验(见8.1例2)。本章主要介绍假设检验的基本概念、思想方法,讨论正态总体参数的检验、频率检验、拟合优度检验(非参数假设检验)等。.1 假设检验的一般概念 一、假设检验的基本思想 先看以下两个例子。,第八章 假设检验,例1 外地一良种小麦,667m2产量(单位:kg)服从正态分布N(400,252),引入本地试种,收获时任取n=5块地,测得其667m2产量分别为400、425、390、450、410,假定引种后667m2产量X也服从正态分布,试问:(1)若方差不变,即X N(,252),本地平均产量 与原产地的平均产量 0=400kg有无显著变化?(2)若X N(,252),本地平均产量是否比原产地平均产量高(或低)?(3)本地引种后,667m2产量的波动情况与原产地667m2产量的波动情况有无显著不同?例2 检查200箱食品,用X表示一箱食品中变质食品的数量(单位:包),n表示有X包变质食品的箱数,检验结果如下:,试问变质食品包数X是否服从泊松分布?,1.两类假设 检验是对假设而言的。假设是对事物的某种“看法”或“陈述”,假设检验是要根据样本值去判断一个 假设是否成立。假设分如下两种:原假设(或零假设)H0:通常是“相等性假设”,例如假定总体均值等于 0,总体方差等于02,总体分布为标准正态分布等。备择假设H1:在原假设被拒绝后可供选择的假设。备择假设H1是和原假设H0不相容的。原假设与备择假设选取以便于数学处理为宜。假设检验的基本思想:带有概率特征的反证法。,例1中,三个问题的假设分别表示为:(1)H0:=0(=400);H1:0(=400)(2)H0:=0(=400);H1:0(=400)H0:=0(=400);H1:0(=400)(3)H0:2=02(=252);H1:202(=252)例2的假设则可表示为:H0:X服从泊松分布;H1:X不服从泊松分布.下面以例1中问题(1)为例。阐明假设检验的基本思想和概念。,设(x1,x2,xn)是来自总体X的样本,则,计,当H0为真时取值集中于0=400附近。如果,是总体均值的无偏估,这需要我们确定一个临界值k,使当,离0较远,则有,理由怀疑H0的真实性,认为或许H1更可靠。,时接受原假设H0;(1),时拒绝原假设H0接受备择假设H1(2),进一步,由于当H0为真时,有,要构造一个具有明确分布的统计量,可将(1)、(2)式转化为,时接受原假设H0(3),时拒绝原假设H0接受备择假设H1(4),当较小时,临界值u/2是小概率事件的分界线,使,具有绝对优势(即有较大概率1-)。故取,于是(3)、(4)式变为,时接受原假设H0(5),时拒绝原假设H0,接受备择假设H1(6),分析(5)、(6)两式,可以这样认为:拒绝H0,是因为以H0成立为出发点进行推理时,得到了不合情理的结论,使小概率事件在一次试验中发生了。接受H0,是因为以H0成立为出发点进行推理时,未发现异常。这就是带有概率特征的反证法,认为小概率事件在一次试验中不可能发生。,2.拒绝域与接受域 称是检验水平或显著性水平,它是我们制定检验标准的重要依据。常数u/2把标准正态分布密度曲线下的区域分成了两大部分,其中一部分,称为H0的拒绝域或否定域,当样本点落入拒绝域时,我们便拒绝原假设H0(同前述(6)式),另一部分,称为H0的接受域,当样本点落入接受域时,我们便接受原假设H0(同前述(5)式)。鉴于u/2的这种特殊作用,称u/2为H0的临界值(相对于例1的问题(1),问题(2)的临界值为u,将在下面说明)。,进一步,可确定例1的问题(2)中两个假设的拒绝域分别为,与,3.双侧检验与单侧检验 双侧检验:拒绝域在接受域两侧的检验 单侧检验:拒绝域和接受域各为一侧的检验称为。且拒绝域在接受域右边的检验,称为右边单侧检验;拒绝域在接受域左边的,称为左边单侧检验。4.两类错误 第一类错误:称为“弃真”错误,即PH0被拒绝/H0为真=第二类错误:称为“纳伪”错误,即PH0被接受/H0不真=,我们希望这两类错误都很小。但可以证明,在样本容量n固定时,同时减小和是办不到的。当减小时必导致增大,反之亦然。要想使和同时减小,只有增大样本容量n。一般是通过选择来控制。质量要求高的检验,常选取较大的,质量要求不高的检验,可适当减小。,综上所述,我们可总结出假设检验的步骤为:(1)根据问题的要求提出假设,写明原假设H0和备择假设H1的具体内容。(2)根据H0的内容,建立(或选取)检验统计量并确定其分布。(3)对给定(或选定)的显著性水平,由统计量的分布查表或计算确定出临界值,进而得到H0的拒绝域和接受域。(4)由样本观察值计算出统计量的值。(5)做出推断:当统计量的值满足“接受H0的条件”时就接受H0,否则就拒绝H0接受H1。(6)完整准确地写出检验的结论。注1 在双侧检验中,备择假设可以略去不写。注2 在假设检验中,当在0.01 0.05下拒绝H0时,通常称差异显著,记作“*”,在 0.01下拒绝H0,通常称差异极显著,记作“*”。,