第四统计假设检验与参数估计.ppt
《第四统计假设检验与参数估计.ppt》由会员分享,可在线阅读,更多相关《第四统计假设检验与参数估计.ppt(149页珍藏版)》请在三一办公上搜索。
1、第四章 统计假设检验与参数估计,统计推断是根据样本分布规律和概率理论,由样本结果去推断总体特征。它主要包括假设检验(test of hypothesis)和参数估计(parametric estimation)两部分内容。,下一张,主 页,退 出,上一张,假 设 检 验 又叫 显著性 检验(test of significance)。显著性检验的方法很多,常用的有u检验、t检验、F检验和2检验等。尽管这些检验方法的用途及使用条件不同,但其检验的基本原理是相同的。参数估计有点估计(point estimation)和区 间 估计(interval estimation)。,下一张,主 页,退 出
2、,上一张,例1:某一酿造厂新引进一种酿醋曲种,以原曲种为对照进行试验。已知原曲种酿出的食醋醋酸含量平均为09.75,其标准差为5.30。现采用新曲种酿醋,得到30个醋样,测得其醋酸含量平均为 11.99。试问,能否由这30个醋样的平均数 判断新曲种好于原曲种?,1 统计假设检验概述,下一张,主 页,退 出,上一张,1.1 统计假设检验的意义和基本原理,1.1.1 统计假设检验的意义,食醋醋酸含量的差异是由于采用新曲种引起的还是由于试验误差引起的?,例2:A,B两种肥料,在相同条件下各施用于5个小区的水稻上,水稻产量平均分别为,二者相差20kg,那么20kg差异究竟是由于两种肥料的不同而造成的还
3、是由试验的随机误差造成的?,例3:小麦良种的千粒重xN(33.5,1.62),现由外地引进一高产品种,在8个小区种植,得千粒重(g):35.6,37.6,33.4,35.1,32.7,36.8,35.9,34.6,平均数为,试问新引进的品种千粒重与当地品种有无显著差异?如果有显著差异,是否显著高于当地品种?,以上这几种问题的判断均是由样本去推断总体的,属于统计假设检验问题,均是来判断数据差异、分布差异是由处理引起,还是由于随机误差引起的。,样本虽然来自于总体,但样本平均数并非是总体平均数。由于抽样误差的影响(随机误差的存在),样本平均数与总体平均数之间往往有偏差。因此,仅由表面效应 是不能判断
4、它们之间是否有显著差异。其根本原因在于 试 验 误差(或抽样误差)的不可避免性。,通过试验测定得到的每个观测值,既由被测个体所属总体的特征决定,又受其它诸多无法控制的随机因素的影响。所以观测值 由两部分组成,即=+总体平均数 反映了总体特征,表示试验误差。若 样本含量 为n,则 可 得 到 n 个 观 测值:,。于是样本平均数,下一张,主 页,退 出,上一张,可以看出,样本平均数并非总体平均数,它还包含试验误差的成分。,试验表面效应为,上式表明,试验的表面效应由两部分构成:一部分是试验的处理效应(即两总体平均数的差异);另一部分是试验误差。因此,仅凭表面效应来判断两总体平均数是否相同是不可靠的
5、。,如果处理效应不存在即,则表面效应仅由误差造成,此时可以说两总体平均数无显著差异;如果处理效应存在,则表面效应不仅由误差造成,更主要由处理效应影响。所以,判断处理效应是否存在是假设检验的关健。,同理,对于接受不同处理的两个样本来说,则有:=+,=+这说明两个样本平均数之差(-)也包括了两部分:一部分是两个总体平均数的差(-),叫 做 试 验 的 处 理 效 应(treatment effect);另一部分是试验误差(-)。,下一张,主 页,退 出,上一张,也就是说样本平均数之差(-)包含有试验误差,它只是试验的表面效应。因此,仅凭(-)就对总体平均数、是否相同下结论是不可靠的。只有 通过 显
6、著性检验 才能从(-)中提取结论。对(-)进行显著性检验就是要分析:试验的表面效应(-)主要由处理效应(-)引起的,还是主要由试验误差所造成。,下一张,主 页,退 出,上一张,处理效应(-)未知,但试验的表面效应是可以计算的,借助数理统计方法可以对试验误差作出估计。所以,可从试验的表面效应与试验误差的权衡比较中间接地推断处理效应是否存在。,下一张,主 页,退 出,上一张,下一张,主 页,退 出,上一张,小概率事件实际不可能性原理,1.1.2 统计假设检验的基本思想,小概率事件在一次试验中被认为是不可能发生的。,小概率事件不是不可能事件,但在一次试验中出现的可能性很小,不出现的可能性很大,以至于
7、实际上可以看成是不可能发生的。在统计学上,把小概率事件在一次试验中看成是实际不可能发生的事件称为小概率事件实际不可能性原理,亦称为小概率原理。小概率事件实际不可能性原理是统计学上进行假设检验(显著性检验)的基本依据。,0.05 0.01 0.001称 之 为 小 概 率 事件。,下一张,主 页,退 出,上一张,举一例子,箱子中有黑球和白球,总数100个,但不知黑球白球各多少个。现提出假设H0:“箱子中有99个白球”,暂时设H0正确,那么从箱子中任取一球,得黑球的概率为0.01,是一小概率事件。今取球一次,如果居然取到了黑球,那么,自然会使人对H0的正确性产生怀疑,从而否定H0。也就是说箱中不止
8、1个黑球。,下一张,主 页,退 出,上一张,1.1.3 统计假设检验的基本原理,1.根据研究目的,对研究总体提出假设,原假设、无效假设、零假设(null hypothesis),是被检验的假设,通过检验可能被接受,也可能被否定。,与H0对应的假设,只有是在无效假设被否定后才可接受的假设。无充分理由是不能轻率接受的。,备择假设(alternative hypothesis),如前例,原假设H0:,即假设由新曲种酿造出的食醋的醋酸含量与原菌种酿造的食醋醋酸含量相等,这个假设表明采用新曲种酿造食醋对提高醋酸含量是无效的,试验的表面效应是随机误差引起的。,对应的备择假设为,即表明采用新曲种酿造食醋能够
9、改变醋酸含量,试验的处理效应存在。,对于来自两个总体的两个样本,原假设H0:,即两个总体的平均数相等,处理效应为零,试验表面效应仅由误差引起,处理效应不存在。,对应的备择假设是:,即假设两个总体的平均数 不相等,亦即存在处理效应,其意义是指试验的表面效应,除包含试验误差外,还含有处理效应在内。,2.在无效假设成立的前提下,构造合适的统计量,并由该统计量的抽样分布计算样本统计量的概率。,下一张,主 页,退 出,上一张,当无效假设H0成立时,表明试验表面效应纯属试验误差引起,处理效应不存在。此时,可根据题意构造适当统计量,计算样本统计量值。,对前例分析,无效假设H0:成立,试验的表面效应是随机误差
10、引起的。那么,可以把试验中所获得的 看成是从 总体中抽取的一个样本平均数,由样本平均数的抽样分布理论可知,,N(0,2n)。,构造统计量:,N(0,1),(4-1),由样本值计算统计量u值,,由正态分布双侧分位数(u)可知,本例计算出的统计量u2.315,1.96 2.58,所以可推知其概率,0.01 0.05,本试验的表面效应 0.0224完全由试验误差造成的概率在0.01-0.05之间。,在统计学上,把小概率事件在一次试验中看成是实际上不可能发生的事件,称为小概率事件实际不可能原理。根据这一原理,当试验的表面效应是试验误差的概率小于0.05时,可以认为在一次试 验中试验表面效应是试验误差实
11、际上是不可能的,因而否定原先所作的无效假设H0,接受备择假设HA,即认为试验的处理效应是存在的。当试验的表面效应是试验误差的概率大于0.05时,则说明无效假设成立的可能性大,不能被否定,因而也就不能接受备择假设。,下一张,主 页,退 出,上一张,3.根据“小概率事件实际不可能性原理”否定或接受无效假设,叫做均数差异标准误;n1、n2为两样本的含量。,对于来自两个总体的样本,研究在无效假设:=成立的前提下,统计量(-)的抽样分布。经统计学研究,得到一个统计量t:,下一张,主 页,退 出,上一张,其中,所得的统计量 t服从自由度 df=(n1-1)+(n2-1)的t分布。,t(df),根据两个样本
12、的数据,计算得:-=11-9.2=1.8;,下一张,主 页,退 出,上一张,进一步估计|t|2.426的两尾概率,即估计P(|t|2.426)是多少?查附表3,在df=(n1-1)+(n2-1)=18时,两尾概率为0.05的临界值:两尾概率为0.01的临界t值:,下一张,主 页,退 出,上一张,=2.101,,=2.878,,即:P(|t|2.101)=P(t2.101)+P(t 2.878)=P(t2.878)+P(t-2.878)=0.01,由两样本数据计算所得的t值为2.426,介于两个临界t值之间,即:t0.052.426t0.01 所以,|t|2.426的概率P介于0.01和0.05
13、之间,即:0.01 P 0.05。如图所示,|t|2.426的两尾概率,说明无效假设成立的可能性,即试验的表面效应为试验误差引起的可能性在0.01 0.05之间。,下一张,主 页,退 出,上一张,按所建立的:=,试验的表面效应是试验误差的概率在 0.01 0.05 之间,小于0.05,故有理由否定:=,从而接受:。可以认为两个总体平均数 和 不相同。综上所述,显著性检验,从提出无效假设与备择假设到根据小概率事件实际不可能性原理来否定或接受无效假设,这一过程实际上是应用所谓“概率性质的反证法”对试验样本所属总体所作的无效假设的统计推断。,下一张,主 页,退 出,上一张,在统计假设检验中,否定或接
14、受无效假设的依据是“小概率事件实际不可能性原理”。用来确定否定或接受无效假设的概率标准 叫 显 著 水 平(significance level),记作。在试验研究中常取=0.05或=0.01。,下一张,主 页,退 出,上一张,1.1.4 统计假设检验的显著水平,假设检验时选用的显著水平,除=0.05和 0.01为常用外,也可选=0.10 或=0.001等等。到底选哪个显著水平,应根据试验的要求或试验结论的重要性而定。如果试验中难以控制的因素较多,试验误差可能较大,则显著水平可选低些,即值取大些。反之,如试验耗费较大,对精确度的要求较高,不容许反复,或者试验结论的应用事关重大,则所选显著水平应
15、高些,即值应该小些。显著水平对假设检验的结论是有直接影响的,所以在试验开始前应给以确定。,下一张,主 页,退 出,上一张,若|t|0.05,即表面效应属于试验误差的可能性大,不能否定:=,统计学上把这一检验结果表述为:“两个总体平均数 与 差异不显著”,在计算所得的t值的右上方标记“ns”或不做任何标记;,下一张,主 页,退 出,上一张,统计假设检验结果说明(两个样本):,若t0.05|t|t0.01,则 说明 试验的表面效应属于试验误差的概率P在0.010.05之间,即0.01 P0.05,表面效应属于试验误差的可能性较小,应否定:=,接受:,统计学上把这一检验结果表述为:“两个总体平均数
16、与 差异显著”,在计算所得的t值的右上方标记“*”;,下一张,主 页,退 出,上一张,若|t|t0.01,则说明试验的表面效应属于试验误差的概率P不超过0.01,即P 0.01,表面效应属于试验误差的可能性更小,应否定:=,接受:,统计学上把这一检验结果表述为:“两个总体平均数 与 差异极显著”,在计算所得的t值的右上方标记“*”。,下一张,主 页,退 出,上一张,1.2 统计假设检验的步骤,建立假设。对样本所属总体提出假设,包括无效假设H0和备择假设HA;确定显著水平。常用的显著水平0.05和0.01;从无效假设H0出发,根据样本提供信息构造适宜统计量,并计算统计量值或概率;由附表查出相应的
17、统计量临界值,比较样本统计量值与临界值大小,根据小概率原理做出统计推断(或由概率大小做出判断)。,1.3 统计假设检验的几何意义与两类错误,1.3.1 统计假设检验的几何意义,统计假设检验从本质上来说,就是根据显著水平将统计量(数)的分布划分为接受区和否定区两部分。前者为接受原假设H0的区间,后者为否定H0,而接受HA的区间。当试验结果落入接受区,就接受H0;反之,否定H0,而接受HA。否定区的概率为,接受区的概率为1-。,是否否定无效假设 或,用实际计算出的统计量u或t的绝对值与显著水平对应的临界值ua 或ta比较。若|u|ua 或|t|ta,则在水平上否定;若|u|ua或|t|ta,则不能
18、在水平上否定。区间 和 或称为水平上的否定域,而区间()则称为水平上的接受域。,下一张,主 页,退 出,上一张,图4-1 双侧检验时H0的接受域和否定域,对前例分析:,所以在a0.05水平上的接受域为,(0.0785 0.1165),否定域为 0.0785,0.1165,试验结果 0.1199,落入否定区间,所以否定,接受,结论:采用新曲种酿造食醋,其醋酸含量有显著改变。,统计假设检验的是根据“小概率事件实际不可能性原理”来否定或接受无效假设的,所以不论是接受还是否定无效假设,都没有100%的把握。也就是说,在检验无效假设时可能犯两类错误。第一类错误:H0本身是成立,但通过检验却否定了它,犯了
19、“弃真”错误,也叫型错误(type error)、错误。型错误,就是把非真实差异错判为真实差异,即 为真,却接 受了。,下一张,主 页,退 出,上一张,1.3.2 统计假设检验的两类错误,第二类错误:H0本身不成立,但通过检验却接受了它,犯了“纳伪”错误,也叫型错误(type error)、错误。型错误,就是把真实差异错判为非真实差异,即 为真,却未能否定。统计检验是基于“小概率事件实际不可能性原理”来否定H0,但在一次试验中小概率事件并不是绝对不会发生的。如果我们抽得一个样本,它虽然来自与H0 对应的抽样总体,但计算所得的统计量却落入了否定域中,因而否定了H0,于是犯了型错误。犯这类错误的概
20、率不会超过a。,下一张,主 页,退 出,上一张,型错误发生的原因可以用图 4-2来说明。图中左边曲线是 为真时,(-)的分布密度曲线;右边曲线是 为真时,(-)的分布密度曲线(),它们构成的抽样分布相叠加。有 时 我 们 从 抽样总体抽取一个(-)恰恰在 成立时的接受域内(如图中横线阴影部分),这样,实际是从 总体抽的样本,经显著性检验却不能否定,因而犯了型错误。犯型错误的概率用 表示。,下一张,主 页,退 出,上一张,图4-2 两类错误示意图,型错误概率 值的大小较难确切估计,它只有与特定的 结合起来才有意义。一般与显著水平、原总体的标准差、样本含量n、以及相互比较的两样本所属总体平均数之差
21、-等因素有关。在其它因素确定时,值越小,值越大;反之,值越大,值越小;样本含量及-越大、均数标准误越小,值越小。,下一张,主 页,退 出,上一张,由于 值的大小与值的大小有关,所以在选用检验的显著水平时应考虑到犯、型错误所产生后果严重性的大小,还应考虑到试验的难易及试验结果的重要程度。若一个试验耗费大,可靠性要求高,不允许反复,那么值应取小些;当一个试验结论的使用事关重大,容易产生严重后果,如药物的毒性试验,值亦应取小些。对于一些试验条件不易控制,试验误差较大的试验,可将值放宽到 0.1,甚至放宽到0.25。,下一张,主 页,退 出,上一张,在提高显著水平,即减小值时,为了减小犯型错误的概率,
22、可适当增大样本含量。因为增大样本含量可使()分布的方差2(1/n1+1/n2)变小,使图 4-2左右两曲线变得比较“高”、“瘦”,叠加部分减少,即 值变小。由于在具体 问题中 往往不是主观能够改变的客观存在,所以通过严密的试验设计、严格的试验操作和增大样本容量n来降低均数标准误,从而降低。,下一张,主 页,退 出,上一张,注意:,在上述显著性检验中,对应于无效假设 的备择假设为。它包含了 或 两种可能。因而有两个否定域,分别为于分布曲线的两尾。这个假设检验的目的在于判断与0有无差异,而不考虑谁大谁小。,下一张,主 页,退 出,上一张,1.4 双侧检验与单侧检验,双侧检验,这样,在水平上否定域有
23、两个 和,对称地分配在u分布曲线的两侧尾部,每侧的概率为/2,如图4-3所示。这种利用两尾概率进行的检验叫 双侧检验(two-sided test),也叫双尾检验(two-tailed test),为双侧检验的临界u值。,下一张,主 页,退 出,上一张,但在有些情况下,双侧检验不一定符合实际情况。如酿醋厂的企业标准规定,曲种酿造醋的醋酸含量应保持在12以上(0),如果进行抽样检验,样本平均数,该批醋为合格产品,但如果 时,可能是一批不合格产品。对这样的问题,我们关心的是 所在总体平均数是否小于已知总体平均数数0(即产品是否不合格)。此时,无效假设应为(产品合格),备择假设则应为HA:(产品不合
24、格)。这样,只有一个否定域,并且位于分布曲线的左尾,为左尾检验,如图4-3B所示,左侧的概率为。,下一张,主 页,退 出,上一张,单测检验,若无效假设H0为,备择假设 HA为 0,此时H0的否定域在 u分布曲线的右尾,右尾检验。在水平上否定域为,右侧的概率为。右尾检验如图4-3A所示。例如,国家规定酿造白酒中的甲醇含量不得超过0.1。在抽样检验中,若样本平均数小于0.1,产品合格,而当平均数0.1,产品为不合格。这样的问题,H0:,HA:0。,下一张,主 页,退 出,上一张,利用一尾概率进行的检验叫单侧检验(one-sided test),也叫单尾检验(one-tailed test)。此时u
25、为单侧检验的临界u值。单侧检验的u=双侧检验的u2。,下一张,主 页,退 出,上一张,临界值u2或t2,2 样本平均数的假设检验,在实际工作中我们往往需要检验一个样本平均数与已知的总体平均数是否有显著差异,即检验该样本是否来自某一总体。即检验无效假设H0:0,备择假设HA:0或0(0)的问题。已知的总体平均数一般为一些公认的理论数值、经验数值或期望数值。常用的检验方法有u检验和t检验。,下一张,主 页,退 出,上一张,2.1 单个样本平均数的假设检验,实质是样本所在总体平均数与已知总体平均数差异显著性检验。,2.1.1 单个样本平均数的u 检验,u 检验(u-test),就是在假设检验中利用标
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四 统计 假设检验 参数估计
链接地址:https://www.31ppt.com/p-5711938.html