欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > DOCX文档下载  

    01第一节 显著性检验的基本原理.docx

    • 资源ID:3139462       资源大小:44.05KB        全文页数:17页
    • 资源格式: DOCX        下载积分:6.99金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要6.99金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    01第一节 显著性检验的基本原理.docx

    01第一节 显著性检验的基本原理第一节 显著性检验的基本原理 一、显著性检验的意义 为了便于理解,我们结合一个具体例子来说明显著性检验的意义。随机抽测10头长白猪和10头大白猪经产母猪的产仔数,资料如下: 长白:11,11,9,12,10,13,13,8,10,13 大白:8,11,12,10,9,8,8,9,10,7 经计算,得长白猪10头经产母猪产仔平均数=11头,标准差S1=1.76头;大白猪10头经产母猪产仔平均数个平均数的差值-=9.2头,标准差S2=1.549头。能否仅凭这两=1.8头,立即得出长白与大白两品种经产母猪产仔数不同的结论呢?统计学认为,这样得出的结论是不可靠的。这是因为如果我们再分别随机抽测10头长白猪和10头大白猪经产母猪的产仔数,又可得到两个样本资料。由于抽样误差的随机性,两样本平均数就不一定是11头和9.2头,其差值也不一定是1.8头。造成这种差异可能有两种原因,一是品种造成的差异,即是长白猪与大白猪本质不同所致,另一可能是试验误差。对两个样本进行比较时,必须判断样本间差异是抽样误差造成的,还是本质不同引起的。如何区分两类性质的差异?怎样通过样本来推断总体?这正是显著性检验要解决的问题。 两个总体间的差异如何比较?一种方法是研究整个总体,即由总体中的所有个体数据计算出总体参数进行比较。这种研究整个总体的方法是很准确的,但常常是不可能进行的,因为总体往往是无限总体,或者是包含个体很多的有限总体。因此,不得不采用另一种方法,即研究样本,通过样本研究其所代表的总体。例如,设长白猪经产母猪产仔数的总体平均数为均数为均数、,试验研究的目的,就是要给,大白猪经产母猪产仔数的总体平、是否相同做出推断。由于总体平作为检验对象,未知,在进行显著性检验时只能以样本平均数、)作为检验对象。 更确切地说,是以2最小。说明样本平均数与样本各个观测值最接近,平均数是资料的代表数。 2、样本平均数是总体平均数的无偏估计值,即E=。 3、根据统计学中心极限定理,样本平均数服从或逼近正态分布。 所以,以样本平均数作为检验对象,由两个样本平均数差异的大小去推断样本所属总体平均数是否相同是有其依据的。 由上所述,一方面我们有依据由样本平均数和的差异来推断总体平均数、相同与否,另一方面又不能仅据样本平均数表面上的差异直接作出结论,其根本原因在于试验误差的不可避免性。若对样本观测值的数据结构作一简单剖析,就可更清楚地看到这一点。 通过试验测定得到的每个观测值,既由被测个体所属总体的特征决定,又受个体差异和诸多无法控制的随机因素的影响。所以观测值由两部分组成,即=+。总体平均数反映了总体特征,表示误差。若样本含量为,则可得到个观测值:,,。于是样本平均数=+。说明样本平均数并非总体平均数,它还包含试验误差的成分。 对于接受不同处理的两个样本来说,则有:=这说明两个样本平均数之差也包括了两部分:一部分是两个总体平均),叫做试验的处理效应;另一部分是试)。也就是说样本平均数的差包含有试验误差,它只、是否相同下-)验误差就对总体平均数结论是不可靠的。只有通过显著性检验才能从中提取结论。对主要由处理效应首先对试验样本所在的总体作假设这里假设=或-=0,即假设长白猪和大白猪两品种经产母猪产仔数的总体平均数相等,其意义是试验的表面效应:-=1.8头是试验误差,处理无效,这种假设称为无效假设:=或-=0。无效假设是被检验的假设,:=或-=0的同时,相。备与,记作通过检验可能被接受,也可能被否定。提出应地提出一对应假设,称为备择假设,记作择假设是在无效假设被否定时准备接受的假设。本例的备择假设是或-:0,即假设长白猪与大白猪两品种经产母猪产仔数的总体平均数与不相等或之差不等于零,亦即存在处理效应,其意义是指试验的表面效应,除包含试验误差外,还含有处理效应在内。 在无效假设成立的前提下,构造合适的统计量,并研究试验所得统计量的抽样分布,计算无效假设正确的概率对于上述例子,研究在无效假设成立的前提下,统计量的抽样分布。经统计学研究,得到一个统计量t: 其中=叫做均数差异标准误;、为两样本的含量。 -1)+(-1)的分布。 所得的统计量t服从自由度df=是多少?查附表3,在df=+(-1)=+=18时,两尾概率为0.05=2.878,即: =2.101,两尾概率为0.01的临界t值:P=P+P=0.05 P=P+P=0.01 由于根据两样本数据计算所得的t值为2.426,介于两个临界t值之间,即: t0.05<2.426<t0.01 所以,|t|2.426的概率P介于0.01和0.05之间,即:0.01<P<0.05。 如图5-1所示,说明无效假设成立的可能性,即试验的表面效应为试验误差的可能性在0.010.05之间。 根据“小概率事件实际不可能性原理”否定或接受无效假设上章曾论及:若随机事件的概率很小,例如小于0.05,0.01,0.001,称之为小概率事件;在统计学上,把小概率事件在一次试验中看成是实际上不可能发生的事件,称为小概率事件实际不可能原理。根据这一原理,当试验的表面效应是试验误差的概率小于0.05时,可以认为在一次试验中试验表面效应是试验误差实际上是不可能的,因而否定原先所作的无效假设:=,接受备择假设:,即认为:试验的处理效应是存在的。当试验的表面效应是试验误差的概率大于0.05时,则说明无效假设接受备择假设:=。 =,试验的表面效应是试验误差的概率在:=,从而接受和:。成立的可能性大,不能被否定,因而也就不能本例中,按所建立的0.010.05之间,小于0.05,故有理由否定可以认为长白猪与大白猪两品种经产母猪产仔数总体平均数不相同。 综上所述,显著性检验,从提出无效假设与备择假设到根据小概率事件实际不可能性原理来否定或接受无效假设,这一过程实际上是应用所谓“概率性质的反证法”对试验样本所属总体所作的无效假设的统计推断。对于各种显著性检验的方法,除明确其应用条件,掌握有关统计运算方法外,正确的统计推断是不可忽视的。 三、显著水平与两种类型的错误 在显著性检验中,否定或接受无效假设的依据是“小概率事件实际不可能性原理”。用来确定否定或接受无效假设的概率标准叫显著水平,记作。在生物学研究中常取=0.05或=0.01。对于上述例子所用的检验方法来说,若|t|<,则说明试验的表面效应属于试验误差的概率P>0.05,即表面效应属于试验误差的可能性大,不能否定:=,统计学上把这一检验结果表述为:“两个总体平均数与差异不显著”,在计算所得的t值的右上方标记“|t|<”或不标记符号;若 ,则说明试验的表面效应属于试验误差的概率P在0.010.05之间,:=,与即0.01<P0.05,表面效应属于试验误差的可能性较小,应否定接受:,统计学上把这一检验结果表述为:“两个总体平均数差异显著”,在计算所得的t值的右上方标记“*”;若|t| ,则说明试验的表面效应属于试验误差的概率P不超过0.01,即P0.01,表面效应属于试验误差的可能性更小,应否定:=,接受与:,统计学上把这一检验结果表述为:“两个总体平均数右上方标记“*”。 这里可以看到,是否否定无效假设差异极显著”,在计算所得的t值的:=,是用实际计算出的检验统计量t,则在水平上否定。区间和的绝对值与显著水平对应的临界t值:=;若|t|<比较。若|t|:=,则不能在水平上否定,称为水平上的否定域,而区间则称为水平上的接受域。 假设检验时选用的显著水平,除=0.05和0.01为常用外,也可选=0.10或=0.001等等。到底选哪种显著水平,应根据试验的要求或试验结论的重要性而定。如果试验中难以控制的因素较多,试验误差可能较大,则显著水平可选低些,即值取大些。反之,如试验耗费较大,对精确度的要求较高,不容许反复,或者试验结论的应用事关重大,则所选显著水平应高些,即值应该小些。显著水平对假设检验的结论是有直接影响的,所以它应在试验开始前即确定下来。 因为显著性检验是根据“小概率事件实际不可能性原理”来否定或接受无效假设的,所以不论是接受还是否定无效假设,都没有100%的把握。也就是说,在检验无效假设时可能犯两类错误。第一类错误是真实情况为成立,却否定了它,犯了“弃真”错误,也叫型错误。型错误,就是把非真实差异错判为真实差异,即二类错误是:=为真,却接受了:。第不成立,却接受了它,犯了“纳伪”错误,也叫型错误:。型错误,就是把真实差异错判为非真实差异,即为真,却未能否定:=。 我们是基于“小概率事件实际不可能性原理”来否定,但在一次试验中小概对应,于是率事件并不是绝对不会发生的。如果我们抽得一个样本,它虽然来自与的抽样总体,但计算所得的统计量t却落入了否定域中,因而否定了犯了型错误。但犯这类错误的概率不会超过。 型错误发生的原因可以用图5-2来说明。图中左边曲线是:=为真时, 的分布密度曲线;右边曲线是:-为真时,的分布密度曲线的分>),布密度曲线;右边曲线是它们构成的抽样 为真时,恰恰在成立时的接受域内,这样,实际是从本,经显著性检验却不能否定0总体抽的样,因而犯了型错误。犯型错误的概率用表结合起来才有意义。示。误概率值的大小较难确切估计,它只有与特定的一般与显著水平、原总体的标准差、样本含量、以及相互比较的两样本所属总体平均数之差-等因素有关。在其它因素确定时,值越小,值越大;-越大、越小,值越小。 反之,值越大,值越小;样本含量及由于值的大小与值的大小有关,所以在选用检验的显著水平时应考虑到犯、型错误所产生后果严重性的大小,还应考虑到试验的难易及试验结果的重要程度。若一个试验耗费大,可靠性要求高,不允许反复,那么值应取小些;当一个试验结论的使用事关重大,容易产生严重后果,如药物的毒性试验,值亦应取小些。对于一些试验条件不易控制,试验误差较大的试验,可将值放宽到0.1,甚至放宽到0.25。 在提高显著水平,即减小值时,为了减小犯型错误的概率,可适当增大样本含量。因为增大样本含量可使分布的方差2变小,使图5-2左右两曲线变得比较“高”、“瘦”,叠加部分减少,即值变小。我们的愿望是值不越过某个给定值,比如=0.05或0.01的前提下,值越小越好。因为在具体问题中含量的大小。 图5-2中的1-称为检验功效或检验力,也叫把握度。其意义是当两总体确有差别时,按水平能发现它们有差别的能力。例-和相对不变,所以值的大小主要取决于样本如1-=0.9,意味着若两总体确有差别,则理论上平均100次抽样比较中有90次能得出有差别的结论。 两类错误的关系可归纳如下: 表5-1两类错误的关系 客观实际 成立 不成立 否定接受型错误 推断正确 推断正确 型错误 四、双侧检验与单侧检验 在上述显著性检验中,无效假设备择假设中包括了>或<:=与备择假设:。此时,与有两种可能。这个假设的目的在于判断无差异,而不考虑谁大谁小。如比较长白猪与大白猪两品种猪经产母猪的产仔数,长白猪可能高于大白猪,也可能低于大白猪。 此时,在水平上否定域为和,对称地分配在t分布曲线的两侧尾部,每侧的概率为/2,如图5-3所示。这种利用两尾概率进行的检验叫双侧检验,也叫双尾检验,为双侧检验的临界t值。但在有些情况下,双侧检验不一定符合实际情况。如采用某种新的配套技术措施以期提高鸡的产蛋量,已知此种配套技术的实施不会降低产蛋量。此时,若进行新技术与常规技术的比较试验,则无效假设应为:=,即假设新技术与常规技术产蛋量是相同的,备择假设应为:>,即新配套技术的实施使产蛋量有所提高。检验的目的在于推断实施新技术是否提高了产蛋量,这时的否定域在t分布曲线的右尾。在水平上否定域为如图5-4A所示。若无效假设为=,备择假设的否定域为为<,右侧的概率为,此时的否定域在t分布曲线的左尾。在水平上,左侧的概率为。如图5-4B所示。这种利用一尾概率进行的检验叫单侧检验也叫单尾检验。此时为单侧检验的临界t值。显然,单侧检验的=双侧检验的。 由上可以看出,若对同一资料进行双侧检验也进行单侧检验,那么在水平上单侧检验显著,只相当于双侧检验在2水平上显著。所以,同一资料双侧检验与单侧检验所得的结论不一定相同。双侧检验显著,单侧检验一定显著;但单侧检验显著,双侧检验未必显著。 选用单侧检验还是双侧检验应根据专业知识及问题的要求在试验设计时就确定。一般若事先不知道所比较的两个处理效果谁好谁坏,分析的目的在于推断两个处理效果有无差别,则选用双侧检验;若根据理论知识或实践经验判断甲处理的效果不会比乙处理的效果差,分析的目的在于推断甲处理是否比乙处理好,则用单侧检验。一般情况下,如不作特殊说明均指双侧检验。 五、显著性检验中应注意的问题 上面我们已详细阐明了显著性检验的意义及原理。进行显著性检验还应注意以下几个问题: 为了保证试验结果的可靠及正确,要有严密合理的试验或抽样设计,保证各样本是从相应同质总体中随机抽取的。并且处理间要有可比性,即除比较的处理外,其它影响因素应尽可能控制相同或基本相近。否则,任何显著性检验的方法都不能保证结果的正确。 选用的显著性检验方法应符合其应用条件。上面我们所举的例子属于“非配对设计两样本平均数差异显著性检验”。由于研究变量的类型、问题的性质、条件、试验设计方法、样本大小等的不同,所用的显著性检验方法也不同,因而在选用检验方法时,应认真考虑其适用条件,不能滥用。 要正确理解差异显著或极显著的统计意义。显著性检验结论中的“差异显著”或“差异极显著”不应该误解为相差很大或非常大,也不能认为在专业上一定就有重要或很重要的价值。“显著”或“极显著”是指表面上如此差别的不同样本来自同一总体的可能性小于0.05或0.01,已达到了可以认为它们有实质性差异的显著水平。有些试验结果虽然差别大,但由于试验误差大,也许还不能得出“差异显著”的结论,而有些试验的结果间的差异虽小,但由于试验误差小,反而可能推断为“差异显著”。 显著水平的高低只表示下结论的可靠程度的高低,即在0.01水平下否定无效假设的可靠程度为99,而在0.05水平下否定无效假设的可靠程度为95%。 “差异不显著”是指表面上的这种差异在同一总体中出现的可能性大于统计上公认的概率水平0.05,不能理解为试验结果间没有差异。下“差异不显著”的结论时,客观上存在两种可能:一是本质上有差异,但被试验误差所掩盖,表现不出差异的显著性来。如果减小试验误差或增大样本含量,则可能表现出差异显著性;二是可能确无本质上差异。显著性检验只是用来确定无效假设能否被推翻,而不能证明无效假设是正确的。 合理建立统计假设,正确计算检验统计量。就两个样本平均数差异显著性检验来说,无效假设与备择假设的建立,一般如前所述,但也有时也例外。如经收益与成本的综合经济分析知道,饲喂畜禽以高质量的号饲料比饲喂号饲料提高的成本需用畜禽生产性能提高个单位获得的收益来相抵,那么在检验喂号饲料与号饲料在收益上是否有差异时,无效假设应为备择假设为:-;或:-:-=,>;t检验计算公式为: 如果不能否定无效假设,可以认为喂高质量的号饲料得失相抵,只有当> 达到一定程度而否定了,才能认为喂号饲料可获得更多的收益。 (五)结论不能绝对化。经过显著性检验最终是否否定无效假设则由被研究事物有无本质差异、试验误差的大小及选用显著水平的高低决定的。同样一种试验,试验本身差异程度的不同,样本含量大小的不同,显著水平高低的不同,统计推断的结论可能不同。否定时可能犯型错误,接受时可能犯型错误。尤其在P接近时,下结论应慎重,有时应用重复试验来证明。总之,具有实用意义的结论要从多方面综合考虑,不能单纯依靠统计结论。 此外,报告结论时应列出,由样本算得的检验统计量值,注明是单侧检验还是双侧检验,并写出P值的确切范围,如0.01<P<0.05,以便读者结合有关资料进行对比分析。

    注意事项

    本文(01第一节 显著性检验的基本原理.docx)为本站会员(牧羊曲112)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开