第6章参数假设检验.ppt
《第6章参数假设检验.ppt》由会员分享,可在线阅读,更多相关《第6章参数假设检验.ppt(86页珍藏版)》请在三一办公上搜索。
1、第6章 参数假设检验,管理统计学谢湘生广东工业大学经济管理学院,6.1 假设检验的基本概念,引例 某厂要在生产线上加工一种直径为100mm的轴,加工出来一批后,检验人员从生产出来的轴中随机抽取了一个由16根轴构成的样本,测量出平均直径为110mm,样本方差为100。问生产线是否出了问题。,实际管理问题中的判断是否准确?,统计学上的假设检验问题,抽样调查获得观察数据,进行假设检验,获得管理问题的正确判断,从管理问题到假设检验,假设“生产线没问题”,加工出来的轴平均直径为100mm,抽取样本,计算出样本的平均直径110mm,H0:=100,H1:100,是不是可能性很小的结果,计算检验统计量,拒绝
2、H0,Y,不拒绝H0,N,与事先定义的小概率进行比较,参数检验:已知总体分布,猜出总体的某个参数(假设H0),用一组样本来检验这个假设,是否正确(是是否拒绝H0)。,非参数检验:猜出总体分布(假设H0),用一组样本来检验这个假设,是否正确(是否拒绝H0)。,应用中对于一个包含参数的总体,经常会遇到这样的问题:我们已经猜到了参数值或知道了参数的理论值,要利用样本来检验总体的参数值是否确实等于所猜到的值或理论值。这就是参数假设检验的问题。,两类错误:在假设检验时有可能犯如下两类错误:,第1类错误(“弃真”错误):拒绝了真实的假设H0。通常称犯第1类错误的概率为显著性水平。,第2类错误(“存伪”错误
3、):接受了错误的假设H0。,这种判断不是绝对意义上的判断,而是“统计意义”上的判断,因而可能出错。,检验时判断的依据小概率事件原理:,小概率事件在一次随机试验中发生的可能性是很小的。,关于小概率事件原理的说明,例如,有一个厂商声称,他的产品的合格品率很高,可以达到99%,那么从一批产品(譬如100件)中随机抽取一件,这一件恰恰好是次品的概率就非常小,只有1%。如果厂商的宣传是真的,随机抽取一件是次品的情况就几乎是不可能发生的。但如果这种情况确实发生了,就有理由怀疑原来的假设,即产品中只有1%的次品的假设是否成立,这时就有理由推翻原来的假设,可以做出厂商的宣传是假的这样一个推断。,依据小概率原理
4、推断可能会犯错误!假设上例中100件产品中确实只有1件是次品,但恰好在一次抽取中被抽到了,按前面的方式将得到一个错误的判断,但犯错误的概率很小,本例是1%,也就是说我们在冒1%的风险做出厂商宣传是假的这样一个推断。,相关的问题:抽到多少件次品,可判断厂商的宣传是假的?,假设检验的步骤,设立假设 设立原假设(null hypothesis)H0和一个与之矛盾的备择假设(alternative hypothesis)H1。构造与计算检验统计量 检验统计量应该包含要检验的参数根据事先给定的小概率值显著性水平进行检验,显著性水平的值通常取0.05或0.01。,6.2 正态总体的参数假设检验,在这一节中
5、总是假设,6.2.1 正态总体均值的假设检验,1.已知方差2,检验假设=0,原假设 H0:=0,备择假设 H1:0,注意备择假设H1相当于两个事件(0)中有一个出现,因此这样的参数检验称为双尾检验(双侧检验)。,统计量的构造:设X1,X2,Xn是X的一组样本,则当原假设H0成立时,有,因此,统计量Z具有特征:一旦给定了样本数据的值,我们就可以计算出该统计量的值z;其分布是完全确定的。于是对于一个充分小的(显著性水平),我们可以找到一个临界值 使得,/2的面积,z/2,即 是小概率事件。,检验:若我们通过样本数据计算得到的统计量Z的值z满足,则上述小概率事件发生了。但小概率事件在一次实验(或观察
6、)中出现的可能性是非常小的。它居然发生了,因此有理由怀疑H0的真实性。也就是我们拒绝原假设。反之,若z满足,我们就不拒绝(接受)原假设H0。,假设检验方法的另一种理解,对引例中的问题,如果按某种生产规范,轴直径的标准差为8。并且一般来说,轴的直径服从正态分布。于是问题转化为,已知正态总体的方差,要检验其均值是否等于100mm的问题。,原假设H0:=0(=100),备择假设H1:0,检验统计量,对于给定的显著性水平=0.05,查表可以到临界值,而,所以拒绝H0,因此生产线可能出了问题。(是否解决了引例中的问题?),2.未知方差2,检验假设=0,上面的讨论表明参数的假设检验中的检验统计量应该满足:
7、1)其值通过样本观察值计算出来;2)其概率分布应该是完全确定的。,如果X的方差2未知,则统计量,不再符合要求。处理的方法是将Z的表达式中的2用其样本方差S2代替。于是得到新的统计量,对于一个充分小的(显著性水平),我们可以找到一个临界值 使得,/2的拒绝域,t/2,记将样本数据代入T统计量的表达式中计算的结果为t,则若,则表示出现了小概率事件。这可能性非常小,但竟然发生了。因此我们怀疑H0的真实性,因此拒绝H0。,反之,若,不拒绝H0。,2.未知方差2,检验假设 0,这实际上指考虑如下假设的检验,原假设 H0:=0,备择假设 H1:0,这一检验称为单尾(单侧)检验,其实际背景见p149,例6.
8、2.3。仍取T为检验统计量,即,面积的拒绝域,t,但拒绝原假设的事件为 其中t满足,例 设正品镍合金线的抗拉强度服从均值为10620(kg/mm2)的正态分布,今从某厂生产的镍合金线中抽取10根,测得平均抗拉强度10600(kg/mm2),样本标准差为80.,问该厂的镍合金线的抗拉强度是否不合格?(=0.1),解:H0:10620;H1:10620,查表得临界值为-t0.1(9)=-1.383,但这里,不拒绝H0,显著性水平的意义,显著性水平的意义可以用如下的表达式描述,因此是犯第1类错误的概率水平。,注意:所谓双尾检验是备择假设具有形式 H1:0的检验,单尾检验为备择假设具有形式 H1:0的
9、检验,6.2.2 p值:与查表找临界值的一种等价判别法,我们是通过由样本观察值计算得到的统计量值与临界值进行比较来判断是拒绝还是不拒绝原假设的。,以未知方差时的双尾检验为例。就是当,时拒绝原假设H0,否则不拒绝H0。,/2的拒绝域,t/2,而临界值 的意义就是:t/2使得,设由样本数据计算得到t(t 0)值,则随机变量T位于t外侧的概率为PT t=1 PT t,t/2,t,-t,概率密度函数曲线下方去掉阴影部分后,剩下部分的面积就是p=2(1 PT t)(如图),称这剩下部分的面积为“t统计值的p值”。很明显,如果 p,则t位于临界值t/2的外侧,因此拒绝H0。t0时可以得到同样的结论(只需对
10、-t进行讨论即可)。,上述讨论表明p值是否定原假设H0的“最低显著性水平(实际显著性水平)”。利用p值进行假设检验的实际意义在于几乎所有的统计软件都自动地计算p值,因此现在利用p值来判断是否拒绝原假设比前面介绍的方法更为方便。,对于单尾检验的情形,检验统计值的p值的定义为,p=1 P相应的统计量 该统计值,若p,则拒绝原假设H0,接受备择假设H1;,若p,则不拒绝原假设H0。,区间估计与假设检验之间的关系,上述假设检验的方法有时也称为显著性方法。此外进行假设检验还有另一种方法置信区间法。,假设总体X服从正态分布,但总体方差2未知。设X1,X2,Xn是X的一组样本。则要检验总体的均值是否为0,可
11、以通过t检验进行。即对于给定的显著性水平,可以查t临界值表,得到临界值。当检验统计量T的值满足,拒绝原假设,否则不拒绝原假设。,若拒绝原假设,意味着有,反之若不拒绝原假设,则意味着,也就是下面表达式成立的概率为,这不等式等价于,将样本数据代入后,这就是置信水平为1 的总体均值的置信区间。换言之,如果要检验的参数假设值落在总体均值的置信区间内,我们应该不拒绝原假设。,例 6.6.1(p168)1.按教材介绍方法:,总体均值的假设值,样本均值,T统计值,p值,样本均值与总体均值差的置信区间下界,对于显著性水平=0.05,由于从SPSS的计算结果得到 p,故不拒绝原假设。,2.利用置信区间进行检验。
12、,由于待检验的总体参数假设值落在置信区间,故应该不拒绝原假设。,思考,某公交公司有81辆公交车,以往的数据表明,每辆车平均百公里耗油33升(标准差为7.25升)。近来油价猛涨,因此今年8月开始公司采用了一系列降低油耗的管理措施,8月份对所有车的油耗统计数据表明,每辆车平均百公里油耗为31.8升。你如何评价这一结果?,第2类错误与样本容量,引例 某厂要在生产线上加工一种直径为100mm的轴,加工出来一批后,检验人员从生产出来的轴中随机抽取了一个由16根轴(?)构成的一个样本,测量出平均直径为110mm,样本方差为100。问生产线是否出了问题。,回顾引例,利用前面介绍的假设检验方法,我们拒绝了总体
13、均值为100mm的原假设。但是也可能有疑问:是不是由于样本数量太少,导致的这一结果?自然地,我们希望知道,多大的样本容量是合适的?,直观地考虑,不难想到:希望犯错误的风险越低,样本容量就应该越大。,某厂要接受供货商提供的一批电池,按设计要求,电池寿命的均值应不低于120小时,现在检验人员从货物中随机抽取了由36个电池构成的一个样本进行检验,以确定是否应该接受这批电池。假设电池的寿命服从正态分布,且已经知道正态分布的标准差为=12。,为便于说明问题,考虑一个类似于引例的例子:,记0=120,并且。考虑,原假设 H0:,备择假设 H1:,则检验统计量为,对给定的显著性水平,若由样本数据计算的统计值
14、,则拒绝原假设H0,而接受备择假设H1。,当显著性水平为0.05时,,因此,当,即,时,拒绝H0,否则,若,则不拒绝H0。,按照这一方法来拒绝H0,犯第一类错误的概率为。但接受H0时,也可能因为H0其实并不真,而犯第二类错误。现在考察犯第二类错误的概率。假设我们得到,则我们将不拒绝H0,但实际上电池的平均寿命为,此时,查正态分布表可知,当z=0.86时,位于z上侧的面积是1-0.8051=0.1949。,面积为0.1949,不拒绝H0,即P(x116.71|)=0.1949,面积为0.1949,不拒绝H0,因此,当真实的均值为115时,只要我们计算的z值对应的x落入图中阴影部分,我们就会不拒绝
15、H0,所以概率,就是我们在 时犯第二类错误的概率。,面积为0.05,拒绝H0,对于同样的z值,它对应的x将落在相对于以0为中心的正态分布的H0的不拒绝域中(如图)。,x=116.71,由此可见,在给定的样本容量下降低犯第一类错误的概率,将增加犯第二类错误的概率。反之亦然,因此,一般不会将显著性水平取得任意小。这时为了将犯第二类错误的概率下降到一个可接受的水平,通常的做法是,增大样本容量。,c,记c为正态分布 下拒绝H0的临界值,则它与标准正态分布下的临界值 的关系是,但与正态分布 比较,可知,在标准正态分布下对应c的临界值,于是,可得,解之得,两边平方就得到给定犯第二类错误临界水平 的总体均值
16、假设检验的样本容量公式,注:对双尾检验,只要将式中的单尾检验的临界值换成相应的双尾检验的临界值即可。,z标准正态分布一侧面积为时对应的z值;z标准正态分布一侧面积为 时对应的z值;0原假设中总体均值的值;a出现第二类错误时总体均值的实际值。,某厂要接受供货商提供的一批电池,按设计要求,电池寿命的均值应不低于120小时,现在检验人员从货物中随机抽取了一个由36个电池构成的一个样本进行检验,以确定是否应该接受这批电池。,考虑例子,关于第一类错误的说明:如果电池的平均寿命为120小时,我们愿冒0.05的风险概率拒绝这批货物。,关于第二类错误的说明:如果电池的平均寿命比规格要求少5小时,我们愿冒0.1
17、0的风险概率接受这批货物。,在本例中,查正态分布表,得,而已知,于是,因而建议选择的样本容量为不低于50。,6.2.3 关于正态总体的方差2的检验,分为如下两种情形未知均值,原假设H0:未知均值,原假设H0:,1.未知均值,原假设H0:,问题的实际背景见p152例6.2.4。,原假设H0:,备择假设H1:,检验统计量 设已经得到样本观察值x1,x2,xn。则可以计算样本方差S 2。根据上一章讨论的结果有统计量,若原假设H0成立,则上面的统计量是一个合乎要求的检验统计量。,对给定的显著性水平,可以确定临界值,使得,因此如果我们通过样本观察值计算得到的2统计量的值2满足,这表明在一次抽样的结果中出
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 参数 假设检验

链接地址:https://www.31ppt.com/p-5763212.html