第五章t检验.ppt
《第五章t检验.ppt》由会员分享,可在线阅读,更多相关《第五章t检验.ppt(114页珍藏版)》请在三一办公上搜索。
1、第五章 t检验,统计推断是根据样本和假定模型对总体作出的以概率形式表述的推断,它主要包括假设检验(test of hypothesis)和参数估计(parametric estimation)二个内容。,下一张,主 页,退 出,上一张,假 设 检 验 又叫 显著性 检验(test of significance)。显著性检验的方法很多,常用的有t检验、F检验和2检验等。尽管这些检验方法的用途及使用条件不同,但其检验的基本原理是相同的。本章以两个平均数的差异显著性检验为例来阐明显著检验的原理,介绍 几种t检验的方法,然 后 介 绍 总 体 参 数 的 区 间 估计(interval estima
2、tion)。,下一张,主 页,退 出,上一张,第一节 显著性检验的基本原理,一、显著性检验的意义 随机抽测10头长白猪和10头大白猪经产母猪的产仔数,资料如下:长白:11,11,9,12,10,13,13,8,10,13 大白:8,11,12,10,9,8,8,9,10,7 经计算,得长白猪 10头经产母猪产仔平均数=11头,标准差S1=1.76头;大白猪10头经产母猪产仔平均数=9.2头,标 准 差S2=1.549头。,下一张,主 页,退 出,上一张,能否仅凭这两个平均数的差值-=1.8头,立即得出长白与大白两品种经产母猪产仔数不同的结论呢?统计学认为,这样得出的结论是不可靠的。这是因为如果
3、 我们再分别随机抽测10 头长白猪和10头大白猪经产母猪的产仔数,又可得到两个样本资料。由于 抽样误差的 随机性,两样本平均数就不一定是11头和9.2头,其差值也不一定是1.8头。造成这种差异可能有两种原因,一是品种造成的差异,即是长白猪与大白猪本质不同所致,另一可能是试验误差(或抽样误差)。,下一张,主 页,退 出,上一张,对两个样本进行比较时,必须判断样本间差异是抽样误差造成的,还是本质不同引起的。如何区分两类性质的差异?怎样通过样本来推断总体?这正是显著性检验要解决的问题。两个总体间的差异如何比较?一种方法是研究整个总体,即由总体中的所有个体数据计算出总体参数进行比较。这种研究整个总体的
4、方法是很准确的,但常常是不可能进行的,因为总体往往是无限总体,或者 是 包含个体很多的有限总体。因此,不得不采用另一种方法,即研究样,下一张,主 页,退 出,上一张,样本,通过样本研究其所代表的总体。例如,设长白猪经产母猪产仔数的总体平均数为,大白猪经产母猪产仔数的总体平均数为,试 验研究的目的,就是要给、是否相同 做出推断。由于总体平均数、未知,在进行显著性检验时只能以样本平均数、作为检验对象,更确切地说,是以(-)作为检验对象。为什么以样本平均数作为检验对象呢?这是因为样本平均数具有下述特征:1、离均差的平方和(-)2最小。说明样本平均数与样本各个观测值最接近,平均数是资料的代表数。,下一
5、张,主 页,退 出,上一张,2、样本平均数 是 总体平均数的 无偏估计值,即E()=。3、根据统计学中心极限定理,样本平均数 服从或逼近正态分布。所以,以样本平均数作为检验对象,由两个样本平均数差异的大小去推断样本所属总体平均数是否相同是有其依据的。由上所述,一方面我们有依据由 样本平均数 和 的差异来推断总体平均数、相 同 与否,另一方面又不能仅据样本平均数表面上的差异直接作出结论,其根本原因在于 试 验 误差(或抽样误差)的不可避免性。,下一张,主 页,退 出,上一张,通过试验测定得到的每个观测值,既由被测个体所属总体的特征决定,又受个体差异和诸多无法控制的随机因素的影响。所以观测值 由两
6、部分组成,即=+总体平均数 反映了总体特征,表示误差。若 样本含量 为n,则 可 得 到 n 个 观 测值:,。于是样本平均数,下一张,主 页,退 出,上一张,说明样本平均数并非总体平均数,它还包含试验误差的成分。对于接受不同处理的两个样本来说,则有:=+,=+这说明两个样本平均数之差(-)也包括了两部分:一部分是两个总体平均数的差(-),叫 做 试 验 的 处 理 效 应(treatment effect);另一部分是试验误差(-)。,下一张,主 页,退 出,上一张,也就是说样本平均数的差(-)包含有试验误差,它只是试验的表面效应。因此,仅凭(-)就对总体平均数、是否相同 下结论是不可靠的。
7、只有 通过 显著性检验 才能从(-)中提取结论。对(-)进行显著性检验就是要分析:试验的表面效应(-)主要由处理效应(-)引起的,还 是 主要 由试验误差所造成。,下一张,主 页,退 出,上一张,虽然处理效应(-)未知,但试验的表面效应是可以计算的,借助数理统计方法可以对试验误差作出估计。所以,可从试验的表面效应与试验误差的权衡比较中间接地推断处理效应是否存在,这就是显著性检验的基本思想。二、显著性检验的基本步骤(一)首先对试验样本所在的总体作假设,下一张,主 页,退 出,上一张,这里假设=或-=0,即假设长白猪和大白猪两品种经产母猪产仔数的总体平均数相等,其意义是试验的表面效应:-=1.8头
8、是试验误差,处理无效,这种假设称为无效假设(null hypothesis),记作:=或。无效假设是被检验的假设,通过检验可能被接受,也可能被否定。提出:=或-=0的同时,相应地提出一对应假设,称为备择假设(alternative hypothesis),记作。备择假设是在无效假设被否定时准备接受的假设。,下一张,主 页,退 出,上一张,本例的备择假设是:或-0,即假设长白猪与大白猪两品种经产母猪产仔数的总体平均数 与 不相等或 与 之差不等于零,亦即存在处理效应,其意义是指试验的表面效应,除包含试验误差外,还含有处理效应在内。(二)在无效假设成立的前提下,构造合适的统计量,并研究试验所得统计
9、量的抽样分布,计算无效假设正确的概率,下一张,主 页,退 出,上一张,对于上述例子,研究在无效假设:=成立的前提下,统计量(-)的抽样分布。经统计学研究,得到一个统计量t:其中=叫做均数差异标准误;n1、n2为两样本的含量。,下一张,主 页,退 出,上一张,所得的统计量 t服从自由度 df=(n1-1)+(n2-1)的t分布。根据两个样本的数据,计算得:-=11-9.2=1.8;,下一张,主 页,退 出,上一张,我们需进一步估计出|t|2.426的两尾概率,即估计P(|t|2.426)是多少?查附表3,在 df=(n1-1)+(n2-1)=(10-1)+(10-1)=18时,两尾概率为0.05
10、的临界值:=2.101,两尾概率为0.01的临界t值:=2.878,即:P(|t|2.101)=P(t2.101)+P(t 2.878)=P(t2.878)+P(t-2.878)=0.01,下一张,主 页,退 出,上一张,由于 根据两样本数据计算所得的 t 值 为2.426,介于两个临界t值之间,即:t0.052.426t0.01 所以,|t|2.426的概率P介于0.01和0.05之间,即:0.01 P 0.05。图5-1|t|2.426的两尾概率 如图5-1所示,说明 无效假设成立的可能性,即试验的表面效应为试验误差的可能性在0.01 0.05之间。,下一张,主 页,退 出,上一张,(三)
11、根据“小概率事件实际不可能性原理”否定或接受无效假设 在统计学上,把小概率事件在一次试验中看成是实际上不可能发生的事件,称为小概率事件实际不可能原理。根据这一原理,当试验的表面效应是试验误差的概率小于0.05时,可以认为在一次试 验 中 试 验 表 面 效 应 是 试 验误差实际上是,下一张,主 页,退 出,上一张,不可能的,因而否定原先所作的无效假设:=,接受备择假设:,即 认为:试验的处理效应是存在的。当试验的表面效应是试验误差的概率大于0.05时,则说明 无效假设:=成立的可能性大,不能被否定,因而也就不能接受备择假设:。,下一张,主 页,退 出,上一张,本例中,按所建立的:=,试验的表
12、面效应是试验误差的概率在 0.01 0.05 之间,小于0.05,故有理由否定:=,从而接受:。可以认为长白猪与大白猪两品种经产母猪产仔数总体平均数 和 不相同。综上所述,显著性检验,从提出无效假设与备择假设到根据小概率事件实际不可能性原理来否定或接受无效假设,这一过程实际上是应用所谓“概率性质的反证法”对试验样本所属总体所作的无效假设的统计推断。,下一张,主 页,退 出,上一张,三、显著水平与两种类型的错误 在显著性检验中,否定或接受无效假设的依据是“小概率事件实际不可能性原理”。用来确定否定或接受无效假设的概率标准 叫 显 著 水 平(significance level),记作。在生物学
13、研究中常取=0.05或=0.01。对于上述例子所用的检验方法(t检验)来说:,下一张,主 页,退 出,上一张,若|t|0.05,即表面效应属于试验误差的可能性大,不能否定:=,统计学上把这一检验结果表述为:“两个总体平均数 与 差异不显著”,在计算所得的t值的右上方标记“ns”或不标记符号;,下一张,主 页,退 出,上一张,若t0.05|t|t0.01,则 说明 试验的表面效应属于试验误差的概率P在0.010.05之间,即0.01 P0.05,表面效应属于试验误差的可能性较小,应否定:=,接受:,统计学上把这一检验结果表述为:“两个总体平均数 与 差异显著”,在计算所得的t值的右上方标记“*”
14、;,下一张,主 页,退 出,上一张,若|t|t0.01,则说明试验的表面效应属于试验误差的概率P不超过0.01,即P 0.01,表面效应属于试验误差的可能性更小,应否定:=,接受:,统计学上把这一检验结果表述为:“两个总体平均数 与 差异极显著”,在计算所得的t值的右上方标记“*”。,下一张,主 页,退 出,上一张,这 里 可 以 看 到,是 否 否 定 无 效 假设,是用实际计算出的检验统计量t的绝对值与显著水平对应的临界t值:ta比较。若|t|ta,则在水平上否定;若|t|ta,则不能在水平上否定。区间 和 称为水平上的 否 定域,而区间()则称为水平上的接 受域。,下一张,主 页,退 出
15、,上一张,假设检验时选用的显著水平,除=0.05和 0.01 为 常 用 外,也 可 选=0.10 或=0.001等等。到底选哪种显著水平,应根据试验的要求或试验结论的重要性而定。如果试验中难以控制的因素较多,试验误差可能较大,则显著水平可选低些,即值取大些。反之,如试验耗费较大,对精确度的要求较高,不 容 许反复,或者试验结论的应用事关重大,则所选显著水平应高些,即值应该小些。显著水平对假设检验的结论是有直接影响的,所以它应在试验开始前即确定下来。,下一张,主 页,退 出,上一张,因为显著性检验是根据“小概率事件实际不可能性原理”来否定或接受无效假设的,所以不论是接受还是否定无效假设,都没有
16、100%的把握。也就是说,在检验无效假设时可能犯两类错误。第一类错误是真实情况为H0成立,却否定了它,犯了“弃真”错误,也叫型错误(type error)。型错误,就是把非真实差异错判为真实差异,即 为 真,却 接 受了。,下一张,主 页,退 出,上一张,第二类错误是H0不成立,却接受了它,犯了“纳伪”错误,也叫型错误(type error)。型错误,就是把真实差异错判为非真实差异,即 为真,却未能否定。我们是基于“小概率事件实际不可能性原理”来否定H0,但在一次试验中 小概率事件 并不是绝对不会发生的。如果我们抽得一个样本,它虽然来自与H0 对应的抽样总体,但计算所得的统计量t却落入了否定域
17、中,因而否定了H0,于是犯了型错误。但犯这类错误的概率不会超过a。,下一张,主 页,退 出,上一张,型错误发生的原因可以用图 5-2来说明。图中左边曲线是 为真时,(-)的分布密度曲线;右边曲线是 为真时,(-)的分布密度曲线(),它们构成的抽样分布相叠加。有 时 我 们 从 抽样总体抽取一个(-)恰恰在 成立时的接受域内(如图中横线阴影部分),这样,实际是从 总体抽的样本,经显著性检验却不能否定,因而犯了型错误。犯型错误的概率用 表示。型,下一张,主 页,退 出,上一张,错误概率 值的大小较难确切估计,它只有与特定的 结合起来才有意义。一般与显著水平、原总体的标准差、样本含量n、以及相互比较
18、的两样本所属总体平均数之差-等因素有关。在其它因素确定时,值越小,值越大;反之,值越大,值越小;样本含量及-越大、越小,值越小。,下一张,主 页,退 出,上一张,由于 值的大小与值的大小有关,所以在选用检验的显著水平时应考虑到犯、型错误所产生后果严重性的大小,还应考虑到试验的难易及试验结果的重要程度。若一个试验耗费大,可靠性要求高,不允许反复,那么值应取小些;,下一张,主 页,退 出,上一张,当一个试验结论的使用事关重大,容易产生严重后果,如药物的毒性试验,值亦应取小些。对于一些试验条件不易控制,试验误差较大的试验,可将值放宽到 0.1,甚至放宽到0.25。,下一张,主 页,退 出,上一张,在
19、提高显著水平,即减小值时,为了减小犯型错误的概率,可 适 当 增 大 样 本 含 量。因为 增 大 样 本 含 量 可 使()分 布 的 方 差 2(1/n1+1/n2)变小,使图 5-2左右两曲线变得比较“高”、“瘦”,叠加部分减少,即 值变小。我们 的 愿 望 是 值不越过某个给定值,比如=0.05或 0.01的前提下,值越小越好。因 为 在 具 体 问 题 中 和相对不变,所以 值的大小主要取决于样本含量的大小。,下一张,主 页,退 出,上一张,表5-1 两类错误的关系,两类错误的关系可归纳如下:,四、双侧检验与单侧检验 在上述显著性检验中,无效假设 与备择假设。此时,备择假设中包括了
20、或 两种可能。这个假设的目的在于判断与有无差异,而 不考虑 谁大谁小。如比较长白猪与大白猪两品种猪经产母猪的产仔数,长白猪可能高于大白猪,也可能低于大白猪。,下一张,主 页,退 出,上一张,此时,在 平上 否 定 域 为 和,对称地分配在 t分布曲线的两侧尾部,每侧的概率为/2,如图5-3所示。这种利用两尾概率进行的检验叫 双侧检验(two-sided test),也叫双尾检验(two-tailed test),为双侧检验的临界t值。,下一张,主 页,退 出,上一张,但在有些情况下,双侧检验不一定符合实际情况。如采用某种新的配套技术措施以期提高鸡的产蛋量,已知此种配套技术的实施不会降低产蛋量。
21、此时,若进行新技术与常规技术的比较试验,则无效假设应为,即假设新技术与常规技术产蛋量是相同的,备 择 假设应为,即 新配套 技术的实施使产蛋,下一张,主 页,退 出,上一张,量有所提高。检验的目的在于推断实施新技术是否提高了产蛋量,这时H0的否定域在 t分布曲线的右尾。在水平上否定域为,右侧的概率为,如图5-4A所示。若无效假设H0为,备择假设 HA为,此时H0的否定域在 t分布曲线的左尾。在水平上,H0的否定域为,左侧的概率为。如图5-4A所示。,下一张,主 页,退 出,上一张,这种利用一尾概率进行的检验叫单侧检验(one-sided test)也叫单尾检验(one-tailed test)
22、。此时t为单侧检验的临界t值。显然,单侧检验的t=双侧检验的t2。由上可以看出,若对同一资料进行双侧检验也进行单侧检验,那么在 水平上单侧检验显著,只相当于双侧检验在 2水平上显著。所以,同一资料双侧检验与单侧检验所得的结论不一定相同。双侧检验显著,单侧检验一定显著;但单侧检验显著,双侧检验未必显著。,下一张,主 页,退 出,上一张,五、显著性检验中应注意的问题 上面我们已详细阐明了显著性检验的意义及原理。进行显著性检验还应注意以下几个问题:(一)为了保证试验结果的可靠及正确,要有严密合理的试验或抽样设计,保证各样本是从相应同质总体中随机抽取的。并且处理间要有可比性,即除比较的处理外,其它影响
23、因素应尽可能控制相同或基本相近。否则,任何显著性检验的方法都不能保证结果的正确。,下一张,主 页,退 出,上一张,(二)选用的显著性检验方法应符合其应用条件。上面我们所举的例子属于“非配对设计两样本平均数差异显著性检验”。由于研究变量的类型、问题的性质、条件、试验设计方法、样本大小等的不同,所用的显著性检验方法也不同,因而在选用检验方法时,应认真考虑其适用条件,不能滥用。,下一张,主 页,退 出,上一张,(三)要正确理解差异显著或极显著的统计意义。显著性检验结论中的“差异显著”或“差异极显著”不应该误解为相差很大或非常大,也不能认为在专业上一定就有重要或很重要的价值。“显著”或“极显著”是指表
24、面上如此差别的不同样本来自同一总体的可能性小于0.05或0.01,已达到了可以认为它们有实质性差异的显著水平。有些试验结果虽然差别大,但由于试验误差大,也许还不能得出“差异显著”的结论,而有些试验的结果间的差异虽小,但由于试验误差小,反而可能推断为“差异显著”。,下一张,主 页,退 出,上一张,显著水平的高低只表示下结论的可靠程度的高低,即在 0.01 水平下否定无效假设的可靠程度为99,而在 0.05水平下否定无效假设的可靠程度为95%。,下一张,主 页,退 出,上一张,“差异不显著”是指表面上的这种差异在同一总体中出现的可能性大于统计上公认的概率水平0.05,不能理解为试验结果间没有差异。
25、下“差异不显著”的结论时,客观上存在两种可能:一是本质上有差异,但被试验误差所掩盖,表现不出差异的显著性来。如果减小试验误差或增大样本含量,则可能表现出差异显著性;二是可能确无本质上差异。显著性检验只是用来确定无效假设能否被推翻,而不能证明无效假设是正确的。,(四)合理建立统计假设,正确计算检验统计量。就两个样本平均数差异显著性检验来说,无效假设 与备择假设 的建立,一般如前所述,但也有时也例外。如经收益与成本的综合经济分析知道,饲喂畜禽以高质量的号饲料比饲喂号饲料提高的成本需用畜禽生产性能提高个d单位获得的收益来相抵,那么在检验喂号饲料与号饲料在收益上是否有差异时,无效假设应为,备择假设为(
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第五 检验

链接地址:https://www.31ppt.com/p-5681694.html