统计学-第五章两均数差别的统计意义.ppt
第五章 两均数差别的统计意义检验,test of statistical significance 又称test of hypothesis,第一节 假设检验的基本步骤,基本步骤:41、建立无效假设null hypothesis和确定检验水准如=0,又称检验假设hypothesis under test,零假设、原假设,用H0表示0:称备择假设或对立假设alternative hypothesis.用H1或HA表示一般取=0.05和0.012、选定检验方法,计算检验统计量,3、确定统计意义的水平和检验用临界值level of significance:指无效假设是对的而被拒绝的可能性,即第I类错误,用表示,常取值0.05、0.01:significant at the 5%level查表获得界值4、统计判断:no statistical significance(NS),statistical significance,highly significant(P0.05,P0.05,P0.01)P,结论为按检验水准,不拒绝H0,无统计学意义(统计结论),还不能认为不同或不等(专业结论)。不拒绝H0不等于接受H0。此时尚没有足够的证据认为H0成立。从决策的观点:可认为暂时接受它,或阴性待观察。下结论时,对只能说拒绝H0或不拒绝H0;而对H1只能说,接受H1,除此之外其他说法均不妥当,假设检验种类,非等效性检验nonequivalence优效性检验superiority等效性检验equivalence非劣效性检验noninferiority,第二节 样本均数和总体均数差别的统计意义检验,inferences from means(one sample/group u,t-test)样本均数代表的未知总体均数和已知总体均数0(一般为理论值、标准值或经过大量观察所得的稳定值)若已知总体标准差,可用统计量u,如果总体标准差未知,只有从样本中获得的标准差s,那么应该用t检验P41例5-1:建立检验假设;选定和计算统计量;查得临界值;确定P值,判断结果。,第三节 配对t检验paired t-test for dependent samples,医学科研中配对设计有:同一批对象身体两个部位的数据同一批对象实验(或处理)前后的配对数据同一批样品用两种方法(两种仪器、两名化验员、两种条件)检验的结果配对试验的结果(两个同质受试对象分别接受两种不同的处理),一、同体比较(自身对照比较)的t检验:见P43例5-2,计算差值d,并假设差值的总体均数为0二、配对实验的t检验:见P44例5-3三、同一批对象两次检验结果差值的t检验,第四节 两样本均数差别的统计意义检验,一、两样本均数差别的t检验two-sample/group t-test for independent samples 又称成组t检验comparison for two means适用于:完全随机设计两样本均数的比较完全随机设计:指分别从两研究总体中随机抽取样本,然后比较两组的平均效应,t值计算公式为:equal variance:the two-sample t test例题:P46例5-5(合并方差combined/pooled v),二、关于非正态分布资料均数差别的检验当资料的分布与正态分布略有偏倚时,对结果影响不会太大,仍可用t检验当资料与正态分布偏倚较大时处理方法:1、n较大时,样本均数仍可近似正态,且S估计的误差较小(每组例数均大于100),用u检验,2、当n较小时,进行数据较换,近拟正态后再作检验。是否符合正态分布应作正态性检验3、用非参数统计方法,第五节 方差不齐时两样本均数差别的t检验,总体方差不等时unequal variance situation正态分布由位置参数和变异度参数两者所决定,t检验需方差齐性。可用F检验来判断P48例56求得F值后查附表6-1 P550,1、近似t检验separate variance estimation t-test:t-test(原版教材称统计量d)。有三种方法,前两种常用Cochran&Cox 法(1950)教科书中介绍的方法:对临界值进行校正,注意:当n1=n2=n时,1=2=,t=tt=t;t和t 值也用双尾概率时的t/2和t/2Satterthwaite 法:对自由度进行校正Welch 法:也是对自由度进行校正重点介绍第一种方法,见书P48例5-6,第六节 两种检验与两类错误一、单侧检验与双侧检验1、若检验目的在于检验两总体均数是否相等,两者谁大谁小都有可能,只要t的绝对值大于0.05界值即认为均数差别有统计学意义,称双侧检验(two-tailed test)或双尾检验2、若已知一个均数不可能低于另一个均数,检验时只需考虑一侧的临界值,称单侧(one-tailed test)或单尾检验单、双侧检验时界值间的关系见面积示意图,图5-1、图5-2(p49-50),二、第一类错误与第二类错误I型错误type I error:拒绝了实际上成立的H0,这类“弃真”的错误称I型错误,其概率大小用表示,可取单尾亦可取双尾。取0.05时,表示当无效假设正确时,在100次抽样中可以有5次推断是错误的。false positive errorII型错误:“接受”不拒绝了实际不成立的H0,这类“取伪”的错误,称type II error。其概率大小用表示,只取单尾,其值的大小在进行检验时一般并不知道。false negative error,Type I error,Type II error,0,0,1,两类错误示意图见P51图5-31-称为检验效能power of a test,过去曾称为把握度。它的意义是当两总体确有差异,按规定检验水准所能发现该差异的能力。只取单尾,1-=0.90,意味着两总体确有差别,理论上在100次检验中,平均有90次能够得出有统计学意义的结论。愈小,愈大,反之亦然。若要同时减小I和II型错误,只有增加样本含量n。注:拒绝H0只能犯I型错误,不可能犯II型错误;“接受”不拒绝H0,只可能犯II型错误。,三、假设检验应注意的问题1、要有严密的研究设计2、不同变量或资料应选用不同的检验方法3、正确理解“显著性”一词的含义:差别有统计学意义,亦称差别有“显著性”,不能理解为差异大。假设检验的结果并不指差异的大小,只能反映两者是否相同,差异的大小只能根据专业知识予以确定。4、作结论不能绝对化:因统计结论具有概率性质,不宜用“肯定”、“一定”、“必定”等词。报告中最好列出统计量的值和P值确切范围。以便读者与同类研究进行比较,5、P值的正确理解:P或=0.05时,作出差别有统计意义的结论。理解:若无效假设正确,从该总体抽样所得的样本,它们能计算得这样的或比它更大的|t|值的可能性小于或等于0.05。决不能把P 或=0.05理解为两总体均数相同的可能性小于或等于0.05。6、统计“显著性”与医学/临床/生物学“显著性”:统计“显著性”对应于统计结论;医学/临床/生物学“显著性”对应于专业结论。统计结论与专业结论有机结合,才能得出恰如其分、符合实际的最终结论。如体重、血压值的差异检验,四、可信区间与假设检验的区别和联系可信区间用于说明量的大小 即推断总体均数的范围,而假设检验用于推断质的不同即判断两总体均数是否不同。1、可信区间亦可回答假设检验的问题:算得的可信区若包含了H0,则按水准不拒绝H0;若不包含H0,则按水准,拒绝H0接受H1。2、可信区间比假设检验可提供更多的信息:CI不但能回答差别有无统计学意义,还能提示差别有无实际专业意义。但并不意味着CI可完全替代假设检验,因CI在预先确定概率情况下计算的,而假设检验可获得精确的概率值,两者结合才是完整的分析。,有实际意义的值,H0,有统计学意义,无统计学意义,有实际意义,可能有实际意义,无实际意义,样本过小,可接受零假设,(1),(2),(3),(4),(5),第七节 正态性检验,一、正态概率纸法:适用于小样本、大样本或分组资料,粗略检验.亦可用Proportion-proportion plot or quartile-quartile plot(PP or QQ plot)将观察值从小到大排序,计算累计百分数,转换成概率单位probability unit:probit查附表5-1,以概率单位为纵坐标,以观察值单位为横坐标,作点图,若点子基本在一直线上,即近似正态分布。,二、偏度与峰度检验(method of moment)正态分布有一定的峰度kurtosis,用g2表示,且左右对称,即偏度skewness,用g1表示,不应太大按P5456计算峰度系数和偏度系数,再作u检验正态时两者都为0,g1为正时表示多数频数集中在左边,少数较大数据向右延伸,曲线向右偏(正偏,医学常见),为负时向左偏(负偏,医学少见);g2为负时曲线较平坦(平阔峰),为正时曲线峰度超出正态分布(尖峭峰),即靠中心处数据过多。,三、W检验(用于3n50时,且不需知道偏离正态的类型),W越大(附表5-3),P越大。四、D检验:用于不需知道偏离正态分布类型,且样本含量50n1000时计算统计量y,y值不在y0.025y0.975之间为有统计意义(附表5-4),拒绝原假设,认为不符合正态分布,