《显著性检验》PPT课件.ppt
第四章 显著性检验,小概率事件实际不可能性原理,1.1.2 统计假设检验的基本原理,在统计学上,把小概率事件在一次试验中看成是实际不可能发生的事件称为小概率事件实际不可能性原理,亦称为小概率原理。小概率事件实际不可能性原理是统计学上进行假设检验(显著性检验)的基本依据。,概率小于0.05称之为小概率事件。,1.1.3 统计假设检验的基本原理及步骤,1.根据研究目的,对研究总体提出假设,无效假设(null hypothesis),是被检验的假设,通过检验可能被接受,也可能被否定。,与H0对应的假设,只有是在无效假设被否定后才可接受的假设。无充分理由是不能轻率接受的。,备择假设(alternative hypothesis),一般情况下=0.05,1.1.3 统计假设检验的基本原理及步骤,2.确定显著水平,3.计算概率,在 成立的前提下,构造合适的统计量,由该统计量的抽样分布计算样本统计量的概率,对前例分析,无效假设H0:成立,试验的表面效应是随机误差引起的。那么,可以把试验中所获得的 看成是从 总体中抽取的一个样本平均数,由样本平均数的抽样分布理论可知,,N(0,2n)。,1.1.3 统计假设检验的基本原理及步骤,=0,根据小概率事件实际不可能原理,当试验的表面效应是试验误差的概率小于0.05时,认为在一次试验中试验表面效应是试验误差实际上是不可能的,因而否定H0,接受HA,即认为试验的处理效应是存在的。,统计推断 根据“小概率事件实际不可能性原理”否定或接受无效假设,1.1.3 统计假设检验的基本原理及步骤,三、显著水平与两种类型的错误(一)显著水平,用来否定或接受无效假设的概率标准叫显著水平,记作。在生物学研究中常取=0.05,称 为 5%显 著 水 平;或=0.01,称 为 1%显 著 水 平或极显著水平。,对于上述例子的检验来说,若u1.96,则说明试验的表面差异属于试验误差的概率p0.05,即表面差异属于试验误差的可能性大,不能否定。统计学上把这一检验结果表述为:“总体平均数与差异不显著”,在计算所得的u 值的右上方标记“”或不标记符号;,若|,则说明试验的表面差异属于试验误差的概率p在0.010.05之间,即0.01p0.05,表面差异 属 于 试 验误差的可能性较小,应否定H0:,接受HA:。统计学上把这一检验结果表述为:“总体平均数与 差异显著”,在计算所得的值的右上方标记“*”;,若|2.58,则说明试验的表面差异属于试验误差的概率p不超过0.01,即p 0.01,表面差异属于试验误差的可能性更小,应否定H0:,接受HA:。统计学上把这一检验结果表述为:“总体平均数与差异极显著”,在计算所得的 值的右上方标记“*”。,可以看到,是否否定无效假设,是用实际计算出的检验统计数的绝对值与显著水平对应的临界值比较:若|,则在 水平上否定 若|,则 不 能 在 水 平 上 否定。,区间 和 称为水平 上的否定域,而区间 则称为 水平上的接受域。,因为在显著性检验中,否定或接受无效假设的依据是“小概率事件实际不可能性原理”,所以我们下的结论不可能有百分之百的把握。,(二)两类错误,例如,经检 验获得“差异显著”的结论,我们有95%的把握否定无效假设H0,同时要冒5%下错结论的风险;经 检验获得“差异极显著”的结论,我们有99%的把握否定无效假设H0,同时要冒1%下错结论的风险;而经 检验获得“差异不显著”的结论,在统计学上是指“没有理由”否定无效假设H0,同样也要冒下错结论的风险。,显著性检验可能出现两种类型的错误:,型错误 与型错误。,型错误又称为错误,就是把非真实的差异错判为是真实的差异,即实际上H0正确,检验结果为否定H0。犯类型错误的可能性一般不会超过所选用的显著水平;,型错误又称为错误,就是把真实的差异错判为是非真实的差异,即实际上HA正确,检验结果却未能否定H0。犯类型错误的可能性记为,一般是随着的减小或试验误差的增大而增大,所以越小或试验误差越大,就越容易将试验的真实差异错判为试验误差。,因此,如果经 检验获得“差异显著”或“差异极显著”,我们有95%或99%的把握认为,这两个样本所在的总体平均数不相同,判断错误的可能性不超过5%或1%;若经 检验获得“差异不显著”,我们只能认为在本次试验条件下,这两个样本所在的总体平均数没有差异的假设 H0:未被否定,这有两种可能存在:或者是这两个总体平均数确实没有差异,或者是这两个总体平均数有差异而因为试验误差大被掩盖了。,因而,不能仅凭统计推断就简单地作出绝对肯定或绝对否定的结论。“有很大的可靠性,但有一定的错误率”这是统计推断的基本特点。,显著性检验的两类错误归纳如下:,表4-1 显著性检验的两类错误,为了降低犯两类错误的概率,一般从选取适当的显著水平和增加试验重复次数来考虑。因为选取数值小的显著水平值可以降低犯类型错误的概率,但与此同时也增大了犯型错误的概率,所以显著水平值的选用要同时考虑到犯两类错误的概率的大小。,对于田间试验,由于试验条件不容易控制完全一致,试验误差较大,为了降低犯型错误的概率,也有选取显著水平为0.10或0.20。通常采用适当增加试验处理的重复次数(即样本容量),以降低试验误差,提高试验的精确度,降低犯型错误的概率。,在【例41】中,对应于无效假设 H0:的备择假设为HA:。HA实际上包含了或这两种情况。此时,在水平上否定域为和,对称地分配在分布曲线的两侧尾部,每侧尾部的概率为。这种利用两尾概率进行的检验叫两尾检验.为 水平两尾检验的临界值。,四、两尾检验与一尾检验,双侧检验时H0的接受域和否定域,两尾检验的目的在于判断 与 有无差异,而不考虑 与 谁大谁小。,在有些情况下两尾检验不一定符合实际情况。,例如,目前我国大豆育种工作者认为,大豆籽粒蛋白质含量超过45%()的品种为高蛋白品种。如果进行样品含量检测,我们关心的是 所在的总体平均数 大于。此时的无效假设仍为H0:,但备择假设则为HA:。这时否定域位于 分布曲线的右尾,即。例如当=0.05时,否定域为。,又如,国家规定稻米中某种农药成分的残留物含量应低于0.1%()。在抽检中,我们关心的是 所在的总体平均数 小于(即该品种属于合格产品)。此时的无效假设仍为H0:,但备择假设则为HA:。这 时 否 定 域 位 于 分 布 曲 线 的 左尾,即。例如当=0.05时,分布的否定域为,见图4-2。,一尾检验的=两尾检验的=2.33。,这种利用一尾概率进行的检验叫一尾检验。此时 为一尾检验的临界 值。显然,一尾检验的=两尾检验的。,例如,一尾检验的=两尾检验的=1.64,,实际应用中,如何选用两尾检验或一尾检验,应根据专业的要求在试验设计时就确定。一般情况下,若事先不知道与谁大谁小,只是为了检验与 是否存在差异,则选用两尾检验;如果凭借一定的专业知识和经验推测 应小于(或大于)时,则选用一尾检验。,第二节 样本平均数与总体 平均数差异显著性检验,在实际研究工作中常常要检验一个样本平均数与已知的总体平均数是否有显著差异,即检验该样本是否来自某一总体。,u 检验(u-test),就是在假设检验中利用标准正态分布来进行统计量的概率计算的检验方法。Excel中统计函数(Ztest)。,单个样本平均数的u 检验,u=(x-),由抽样分布理论可知,有两种情况的资料可以用u检验方法进行分析:1.样本资料服从N(,2),并且总体方差2已知2.总体方差虽然未知,但样本为大样本(n30),单个样本平均数的u 检验,(一)如果总体 已知或 未知但为大样本(n 30),则用u 检验法。,例:糯玉米苏糯1号的鲜果穗重x-N(216.5,45.2)。现引进一高产品种奥特1号,在8个小区种植,得其鲜果穗重分别为:255.0,185.0,252.0,290.0,159.9,190.0,212.7,278.5,试问新引入品种的鲜果穗重与苏糯1号有无显著差异?,提出假设,:,216.5g,:,216.5g,3、计算 u 值 u 值计算公式为,,,2.确定显著水平,=0.05,4统计推断,故p0.05,不能否定 表明新引进品种新果穗重与苏糯1号差异不显著。,1.96,u=0.712,:,216.5g,2.1.1 单个样本平均数的u 检验,以本例演示Excel中统计函数(Ztest)的使用,2 样本平均数的假设检验-u 检验,u=(x-),(二)如果总体 未知、且为小样本(n 30),则用t检验法。,t 检验法,就是在显著性检验时利用 t分布进行概率计算的检验方法。,【例43】晚稻良种汕优63的千粒重 27.5g。现育成一高产品种协优辐819,在9个小区种植,得其千粒重为:32.5、28.6、28.4、24.7、29.1、27.2、29.8、33.3、29.7(g)问新育成品种的千粒重与汕优63有无显著差异?,提出假设,:,27.5,:,27.5g。,2、计算t值 t值计算公式为,,,此例,先计算样本平均数、样本标准差S、样本均数标准误 如下:,29.255,=2.587,=,=,=0.862,所以,=,=2.036,3统计推断,由df=n-1=9-1=8查临界t值,得:计算所得的,故p0.05,不能否定,表明新育成品种千粒重与当地良种汕优63的千粒重差异不显著,可以认为新育成品种千粒重与当地良种汕优63的千粒重相同。,第三节两个样本平均数差异显著性检验,两个样本平均数差异显著性检验,因试验设计不同,分为非配对设计和配对设计两种。检验方法有u检验法和t检验法两种。,一、非配对设计两个样本平均数 差异显著性检验,非配对设计是将试验单位完全随机地分为两组,然后再随机地对两组分别实施两个不同处理;两组试验单位相互独立,所得观测值相互独立;两个处理的样本容量可以相等,也可以不相等,所得数据称为非配对数据。这种设计适用于试验单位比较一致的情况。,【例45】测得马铃薯两个品种鲁引1号和大西洋的块茎干物质含量结果如 表 4-3 所示。试检验两个品种马铃薯的块茎干物质含量有无显著差异。,4-3 两个马铃薯品种干物质含量(%),1、提出假设,2、计算t值 t值计算公式为,其中,、,、分别为两样本含量、平均数;为样本均数差数标准误,计算公式为,当 时,,其中,、分别为两样本均方。,此例,18.193,0.248,=6,=5,于是,3、统计推断,根据,查附表3得:=2.262 因为计算得的 1.922,故p0.05,不能否定H0:,表明两个马铃薯品种的块茎干物质含量差异不显著,可以认为两个马铃薯品种的块茎干物质含量相同。,注意,两个样本平均数差异显著性检验的无效假设 与备择假设,一般如前所述,但也有例外。例如通过收益与成本的综合经济分析知道,施用高质量的肥料比施用普通肥料提高的成本需用产量提高 个单位获得的收益来相抵,那么在检验施用高质量的肥料比施用普通肥料收益上是否有差异时,无效假设应为,备择假设为(两尾检验);,在检验施用高质量肥料的收益是否高于施用普通肥料时,无效假设应为,备择假设为(一尾检验)。,此时,t检验计算公式为:,二、配对设计两个样本平均数 差异显著性检验,配对设计是指先根据配对的要求将试验单位两两配对,然后将配成对子的两个试验单位随机实施某一处理。配对的要求是,配成对子的两个试验单位的初始条件尽量一致,不同对子间试验单位的初始条件允许有差异,每一个对子就是试验处理的一个重复。,例如,在相邻两个小区、两个盆钵实施两种不同处理;在同一植株(或器官)的对称部位上实施两种不同处理;在同一供试单位上进行处理前和处理后的对比等,都是配对试验设计,所得观测值称为成对数据。,【例47】选取生长期、发育进度、植株大小和其他方面皆比较一致的相邻的两块地(每块地面积为666.7)的红心地瓜苗构成一组,共得6组。每组中一块地按标准化栽培,另一块地进行绿色有机栽培,用来研究不同栽培措施对产量的影响,得每块地瓜产量如表4-4所示,试检验两种栽培方式差异是否显著。,表4-4 两种栽培方法的地瓜产量(kg/666.7),采用两尾t检验法。,1、提出假设 H0:;,HA:。,其中,为第一个样本所在的总体平均数,,为第二个样本所在的总体平均数,,为两个样本各对数据之差数所在的总体平均数,,2、计算t值 计算公式为,,其中,为差数标准误,为配对的对子数。,本例,,1770.8+1449.7+1400.6+(59.3)+(208.7)+(300.3)=675.467,391.525,于是,,=1.725,3、统计推断,查 附 表 3,当 时,=2.571,计算所得的 1.725,故 p 0.05,不 能 否 定 H0:,表明两种栽培方法的地瓜产量差异不显著,可以认为两种栽培方法的地瓜产量相同。,第四节 百分率资料的显著性检验,由具有两个属性类别的质量性状利用统计次数法得来的次数资料进而计算出的百分率资料,如结实率、发芽率、病株率、杂株率以及一对性状的杂交后代中某一性状的植株占总株数的百分率等是服从二项分布的。这类百分率资料的假设检验应按二项分布进行。,当样本含量n足够大,p不过小,np 和nq均大于5时,二项分布接近于正态分布,此时可近似地采用u检验法(称为正态近似法)对服从二项分布百分率资料进行差异显著性检验。适用于正态近似法所需的二项分布百分率资料的样本含量n见表4-5。,表4-5 适用于正态近似法所需要的二项 分布百分率资料的样本容量n,一、样本百分率与总体百分率差异显著性检验,检验一个服从二项分布的样本百分率与已知的二项总体百分率p0差异是否显著,其目的在于检验一个样本百分率 所在二项总体百分率 p 是否与已知二项总体百分率p0相同,换句话说,检验该样本百分率 是否来自总体百分率为p0 的二项总体。,这里所讨论的百分率是服从二项分布的,当满足n足够大,p不过小,np和nq均大于5的条件时,可近似地采用u检验法,即正态近似法来进行显著性检验;若np和nq均大于30,不必对u进行连续性矫正。,【例48】用糯玉米和非糯玉米杂交,预期F1 植株上糯性花粉粒的百分率为=0.50。现检视150粒花粉,得糯性花粉68粒,糯性花粉粒百分率=0.453,问此结果和理论百分率=0.50是否相符?,本 例 的糯性花粉粒百分率服从二项分布,但样本容量n=150较大,np=75、nq=75均大于5(注意,此处假定,来计算np和nq),所以采用正态近似法来进行显著性检验;且要回答的问题是糯性花粉粒样本百分率=0.453与理论百分率=0.50是否相符,故采用两尾u检验;由于np=75、nq=75均大于30,不必对u进行连续性矫正。,检验步骤如下:,1、统计假设,H0:HA:=0.50,2、计算u值 u值的计算公式为:,其中,为样本百分率,=0.5为已知总体百分率,为样本百分率标准误:,其中,n为样本容量。,本例,,于是,,3、统计推断,计算所得的,故p0.05,不能否定H0:,表明糯性花粉样本百分率 0.453和 差异不显著,可以认为糯性花粉粒样本百分率=0.453所在的总体百分率 与理论百分率=0.50相同。,p,二、两个样本百分率差异显著性检验,检 验 服 从 二 项分布的两个样本百分率、差异是否显著,其目的在于检验两个样本百分率、所在的两个总体百分率、是否相同。,当两样本的np、nq均大于5时,可以采用正态近似法,即u检验法进行检验;若两样本的np和nq均大于30,不必对u进行连续性矫正。,【例49】调查春大豆品种 A的 120个豆荚(=120),其 中 有 瘪 荚38荚(f1=38),瘪荚率31.7%();调查春大豆品种B的135个豆荚(=135),其 中有瘪荚52荚(f2=52),瘪荚率38.5%()。试 检 验 这两个品种的瘪荚率差异是否显著?,本例为服从二项分布的百分率资料,样本容量较大,=120,=135,且,均大于5(注意,假定 成立,为合并样本百分率,由(4-22)式计算),可以采用正态近似法,即u检验法进行显著性检验,要回答的问题是两个品种的瘪荚率差异是否显著,故 采用两尾u检验;由于,均大于30,不必对u进行连续性矫正。,,,检验步骤如下:,1、统计假设,H0:;HA:。,2、计算u值 u值的计算公式为:,其中,为两个样本百分率,为样本百分率差异标准误,,为合并样本百分率,本例,,10.3530.647,于是,,3、统计推断,由于计算所得的 0.05,不能否定H0:,表明两个品种的瘪荚率差异不显著,可以认为两个品种的瘪荚率相同。,三、百分率资料显著性检验的连续性矫正,(一)样本百分率与总体百分率差异显著性检验 的连续性矫正,检验一个服从二项分布的样本百分率与已知的二项总体百分率差异是否显著,当满足n足够大,p不过小,np和nq均大于5的条件时,可近似地采用 u检验法,即正态近似法来进行显著性检验;如果此时np和(或)nq小于或等于30,还须对u进行连续性矫正。,将连续性矫正后计算的值记为,的计算公式为:,检验的其它步骤同【例48】。,(二)两个样本百分率差异显著性检验的连续性矫正,检验服从二项分布的两个样本百分率差异是否显著,当两样本的np、nq均大于5时,可以采用正态近似法,即u检验法进行检验;如果此时两样本的np和(或)nq小于或等于30,还须对u进行连续性矫正。,值的计算公式为:,检验的其它步骤同【例49】。,【例410】调查大豆A品种20荚,其中三粒荚14荚,两粒以下荚 6荚,三粒荚百分率为0.70;B品种25荚,其中三粒荚7荚,两粒以下荚18荚,三粒荚百分率为0.467。问两 个 大豆品种的三粒荚百分率差异是否显著?,由于本例,20,25,,14,7,均大于5,可以采用正态近似法,即u检验法进行显著性检验,要回答的问题是两个品种的三粒荚百分率差异是否显著,故采用两尾u检验;但由于小于30,须对u进行连续性矫正。,检验步骤如下:,1、统计假设,H0:;HA:。,2、计算值,因为,于是,,3、统计推断,由于计算所得的 介于1.96与2.58之间,故0.01p0.05,否定H0:,两个大豆品种的三粒荚百分率差异显著,这里表现为A品种的三粒荚百分率显著高于B品种。,第五节参数的区间估计,参数估计就是用样本统计数来估计总体参数,有点估计和区间估计之分。,将样本统计数直接作为总体相应参数的估计值叫点估计。点估计只给出了总体参数的估计值,没有考虑试验误差的影响,也没有指出估计的可靠程度。,区间估计是在一定概率保证下给出总体参数的可能范围,所给出的可能范围叫置信区间,给出的概率保证称为置信度或置信概率。,一、正态总体平均数的置信区间,设有一来自正态总体的样本,包含个观测值,样本平均数,标准误,总体平均数为。,因为服从自由度为-1的分布,两尾概率为时,有:,P(,也就是说,在区间 内取值的可能性为1-,即:,对 变形得:,亦即,(4-25)式称为总体平均数 置信度为1-的置信区间,,称为置信半径;,L1=和L2=分别称为置信下限和置信上限;,置信上、下限之差称为置信距,置信距越小,估计的精确度越高。,总体平均数的95%和99%的置信区间如下:,【例411】测得某高产、抗病小麦品种的8个千粒重,计算得千粒重平均数=45.2g,标准误。试求该品种小麦千粒重在置信度为 95 的置信区间。,查 附 表 3,当 df=(8-1)=7 时,得,故95的置信度区间为:,(45.22.3650.58)g(45.2+2.3650.58)g,43.828g 46.572g,说明置信度为95时,该高产、抗病小麦品种的千粒重在43.82846.572g之间。,二、二项总体百分率 的置信区间,求总体百分率的置信区间有两种方法:正态近似法和查表法,这里仅介绍正态近似法。,当,p 时,总体百分率p的95%、99%置信区间为:,其中,为样本百分率,为样本百分率标准误,的计算公式为:,【例412】调查某品种水稻1200株,受二化螟危害的有200株,即=200/1200=0.1667。试估计置信度为95%的二化螟危害率的置信区间。,先计算样本百分率标准误,得:,置信下限L1和置信上限L2为:,L1=0.16671.960.0108=0.1455,L2=0.1667+1.960.0108=0.1879,即水稻二化螟危害率的95%置信区间为14.55%18.79%。,