生物统计附试验设计第七章卡方检验ppt课件.ppt
第七章 次数资料分析 2检验,在科学研究中,除了分析计量资料外,还常常需要对次数资料、等级资料与相对数资料进行分析。2 检验可以分析试验结果为两种以上属性的次数资料的差异显著性。本章将介绍卡平方检验用于分析次数资料适合性和独立性检验的方法。,第一节 2统计量与2分布第二节 适合性检验第三节 独立性检验,第一节 2统计量与2分布一、2统计量的意义 某年对某一农场羊羔性别进行调查,结果如下表表7-1 羔羊性别实际观察次数与理论次数,问题:公、母性别差异是属于抽样误差(把对该羊场一年所生羔羊的性别统计当作是一次抽样调查)、还是羔羊性别比例发生了实质性的变化?要回答这个问题,首先需要确定一个统计量用以表示实际观察次数与理论次数偏离的程度;然后判断这一偏离程度是否属于抽样误差,即进行显著性检验。,(A-T)(A-T)2 2是度量实际观察次数与理论次数偏离程度的一个统计量。2越小,表明实际观察次数与理论次数越接近;2=0,表示两者完全吻合;2越大,表示两者相差越大。,二、卡平方分布 设有一平均数为、方差为2的正态总体。现从此总体中独立随机抽取n个随机变量x1、x2、.xn,并求出其标准正态离差:则这n个相互独立的标准正态离差的平方和即:,它服从自由度为n的2分布,记为,若用样本平均数 代表总体平均数,则随机变量 服从自由度为n-1的2分布,记为,显然,20,即2 的取值范围是0,+)2 分布密度曲线是随自由度不同而改变的一组曲线。随自由度的增大,曲线由偏斜渐趋于对称;df30时,接近正态分布。,不同自由度的卡平方分布图,三、2 的连续性矫正 2分布是连续性分布,而次数资料是间断性的。由次数资料计算得的2 均有一定的偏差,特别是当自由度为1时偏差较大。Yates(1934)提出了一个矫正公式,矫正后的2值记为2c:,当自由度大于1时,2分布与连续型随机变量2分布相近似,这时,可不作连续性矫正,但要求各组内的理论次数不小于5。若某组的理论次数小于5,则应把它与其相邻的一组或几组合并,直到理论次数大 于5 为止。,第二节 适合性检验,一、定义 判断实际观察的次数(属性)分配是否符合已知次数(属性)分配理论或学说的假设检验。二、步骤 1、建立假设 H0:实际观察的属性类别分配符合已知属性类别分配的理论或学说;,HA:实际观察的属性类别分配不符合已知属性类别 分配的理论或学说。,例如:在研究鲤鱼遗传规律试验中,F2观测结果如下,是否符合3:1比率?,H0:鲤鱼体色F2分离符合3:1比率;HA:鲤鱼体色F2分离不符合3:1比率;,2、在无效假设成立的条件下,按已知属性分配的理论或学说计算各属性的理论次数和自由度。适合性检验的自由度等于属性分类数(k)减1。,df=k-1=2-1=1,需要连续性校正,3、计算出2 或2c,在无效假设H0正确的前提下,青灰色的理论数为:Ei 16023/4=1201.5,红色理论数为:Ei 16021/4=400.5,=75.41+226.22301.63,4、将所计算得的2或 值与根据自由度k-1查值表(附表4)所得的临界值:、比较,作出结论。若2(或),P0.05,表明实际观察次数与理论次数差异不显著;若 2(或),0.01 P 0.05,表明实际观察次数与理论次数差异显著;若2(或),P 0.01,表明实际观察次数与理论次数差异极显著。,查2值表,当df=1时,20.05 3.84。现实得2c 301.6320.05,故应否定H0,接受HA,即认为鲤鱼体色F2分离不符合3:1比率。,F2代,共556粒,例:豌豆圆粒和皱粒分离规律研究,?,此结果是否符合自由组合规律,根据自由组合规律,理论分离比为:,豌豆杂交实验F2分离结果,(1)H0:豌豆F2分离符合9:3:3:1的自由组合规律;HA:豌豆F2分离不符合9:3:3:1的自由组合规律;,(2)取显著水平 0.05,(3)计算统计数2值:,2 0.016+0.101+0.135+0.2180.470,(4)查值表,进行推断:,df=4-13,2 20.05,P0.05,接受H0,即豌豆F2分离符合9:3:3:1的自由组合规律。,第三节 独立性检验,一、独立性检验的意义 对次数资料,除了进行适合性检验之外,有时需要分析两类因子是相互独立或彼此相关。这种根据次数资料判断两类因子彼此相关或相互独立的假设检验就是独立性检验。,独立性检验与适合性检验是两种不同的检验方法,除了研究目的不同外,还有以下区别:(一)资料归组方式不同 独立性检验的次数资料是按两因子属性类别进行归组,根据两因子属性类别的不同而构成22、2c、rc列联表(r为行因子的属性分类数,c为列因子的属性分类数)。,适合性检验只按某一因子的属性类别将如性别、表现型等次数资料归组。(二)理论次数的计算依据不同 适合性检验按已知的属性分类理论或学说计算理论次数。独立性检验在计算理论次数时没有现成的理论或学说可资利用,理论次数是在两因子相互独立的假设下进行计算。,(三)自由度的计算 适合性检验中自由度为属性类别数(k)减1;rc列联表的独立性检验中自由度为rc-1-(r-1)-(c-1)=(r-1)(c-1),即等于(横行属性类别数-1)(直列属性类别数-1)。,二、22表独立性检验,在做22表的独立性检验时,df=(2-1)(2-1)=1,故计算2时需做连续性矫正。一般形式如下:22列联表一般形式,给药方式与给药效果的22列联表,1.H0:给药方式与给药效果相互独立。,HA:给药方式与给药效果有关联。,2.给出显著水平0.05,3.根据H0,运用概率乘法法则:事件A与事件B同时出现的概率为:P(AB)=P(A)P(B),口服与有效同时出现的理论频率口服频率有效频率,即P(AB)=P(A)P(B)98/193 122/193,理论频数Ei理论频率总数,(98/193 122/193)193,(98 122)/193=61.95,即EijRiCj/T=行总数列总数/总数,E11=R1 C1/T=61.95 E12=R1 C2/T=36.05,E21=R2 C1/T=60.05 E22=R2 C2/T=34.95,给药方式与给药效果的22列联表,计算2值:由于df=(r-1)(c-1)=(2-1)(2-1)=1,故所计算的2值需进行连续性矫正:,4.查2表,当df=1时,20.05 3.841,而2c=0.863 20.05,P0.05,应接受H0,拒绝HA,说明给药方式与给药效果相互独立.,在进行独立性检验时,也可以不经过计算理论次数而直接用实际观察次数计算2。22表,2c表的一般形式如下,2c表的独立性检验也可以不经过计算理论次数而直接用实际观察次数计算2:或,rc表的一般形式如下,rc表的独立性检验的2计算:,式中:i=1,2,r;j=1,2,c,t检验、F检验和卡方检验在应用上有何主要区别?t检验、F检验主要应用于数量性状资料的显著性检验,其理论分布是正态分布;卡方检验主要应用于质量性状资料的显著性检验,其理论分布是二项分布或波松分布;,t检验主要用于两样本平均数(或一个样本平均数与总体平均数)间的差异显著性检验;F检验主要应用于样本平均数的个数大于或等于3时的假设检验。,小 结,1、掌握适合性检验、独立性检验、卡方的连续性矫正的概念;2、掌握两种卡方检验方法的步骤;3、了解t 检验、F 检验和卡方检验三种方法的区别与联系。,