卡方拟合优度检验.ppt
《卡方拟合优度检验.ppt》由会员分享,可在线阅读,更多相关《卡方拟合优度检验.ppt(62页珍藏版)》请在三一办公上搜索。
1、生物统计学,第七章 拟合优度检验-2检验,拟合优度检验的意义 判断实际观察的属性类别分配是否符合已知属性类别分配理论或学说的假设检验。简单的说:用于检验总体是否服从某个指定分布。.检测观察数与理论数之间的一致性;.通过检测观察数与理论数之间的一致性来判定事物之间的独立性。,7.1、拟合优度检验的一般原理,7.1.1 什么是拟合优度检验(P92),一、2统计量的意义 为了便于理解,现结合一实例说明2(读作卡方)统计量的意义。根据遗传学理论,动物的性别比例是1:1。统计某一年所产的876只实验动物,有雄性428只,雌性448只。按1:1的性别比例计算,雌雄均应为438只。以Oi表示实际观察次数,T
2、i 表 示 理 论次数,可将上述情况列成下表。,7.1.2 拟合优度检验的统计量(P92),表 动物性别实际观察次数与理论次数,从上表可以看到,实际观察次数与理论次数存在一定的差异。这个差异是属于抽样误差、还是其性别比例发生了实质性的变化?要回答这个问题:首先需要确定一个统计量用以表示实际观察次数与理论次数偏离的程度;然后判断这一偏离程度是否属于抽样误差,即进行显著性检验。,为了度量实际观察次数与理论次数偏离程度:A:最简单的办法是求出实际观察次数与理论次数的差数。如上表:O1-T1=-10,O2-T2=10,由于这两个差数之和为0,显然此方法不可行;B:计算(O-T)2,其值越大,实际观察次
3、数与理论次数相差亦越大,反之则越小。但尚有不足。例如某一 组 实 际 观 察 次 数为505、理论次数为500,相差5;而另一组实际观察次数为26、理论次数为21,相差亦为5。,为了弥补B这一不足,将各差数平方除以相应的理论次数后再相加,并记之为2,即,也就是说2是度量实际观察次数与理论次数偏离程度的一个统计量,2越小,表明实际观察次数与理论次数越接近;2=0,表示两者完全吻合;2越大,表示两者相差越大。,二、2分布 上面引入了统计量2,它近似地服从统计学中一种连续型随机变量的概率分布2分布。下面对统计学中的2分布作一简略介绍。设有一平均数为、方差为 的正态总体。现从此总体中独立随机抽取n个随
4、机变量:x1、x2、xn,并求出其标准正态离差:,记这n个相互独立的标准正态离差的平方和为2:它服从自由度为n的2分布,记为 2(n);,若用样本平均数 代替总体平均数,则随机变量 服从自由度为n-1的2分布,记为,显 然,20,即 2 的 取 值 范 围 是0,+;2分布密度曲线是随自由度不同而改变的一组曲线。随自由度的增大,曲线由偏斜渐趋于对称;df30时,接近正态分布。下面给出了几个不同自由度的2概率分布密度曲线。,的连续性矫正 由公式计算的2只是近似地服从连续型随机变量2分布。在对次数资料进行2检验利用连续型随机变量2分布计算概率时,常常偏低,特别是当自由度为1时偏差较大。Yates(
5、1934)提出了一个矫正公式,矫正后的2值记为:=(7-2),当自由度大于1时,原公式的2分布与连续型随机变量2分布相近似,这时,可不作连续性矫正,但要求各组内的理论次数不小于5。若某组的理论次数小于5,则应把它与其相邻的一组或几组合并,直到理论次数大 于5 为止。,统计量:使用条件:各理论值均大于5。若自由度为1,则应作连续性矫正:,方法为:把x的值域分为r个不相重合的区间,再计算在指定的分布下,x落入每一区间的概率pi 统计样本含量为n的抽样中,观察值落入各区间的次数Oi用统计量进行检验,步骤如下:,7.2、拟合优度检验,7.2.1 一般程序(P93),检验步骤如下:(一)提出无效假设与备
6、择假设(二)选择计算公式(三)计算理论次数(四)计算2值(五)查临界2值,作出统计推断,说明:(一)H0:实际观察的属性类别分配符合已知属性类别分配的理论或学说;HA:实际观察的属性类别分配不符合已知属性类别分配的理论或学说。(二)选择计算出2还是2c。(三)在无效假设成立的条件下,按已知属性类别分配的理论或学说计算 各属性类别的理论次数。,(四)计算出2或2c。(五)根据自由度k-1(若属性类别分类数为 k,则适合性检验的自由度为 k-1)查2值表(附表)所得的临界2值:20.05、20.01,将所计算得的2或2c值与其比较,作出统计推断:若2(或2c)20.05,P0.05,表明实际观察次
7、数与理论次数差异不显著,可以认为实际观察的属性类别分配符合已知属性类别分配的理论或学说;若20.052(或2c)20.01,若2(或2c)20.01,,下面结合实例说明适合性检验方法。(总体参数已知)【例】在研究牛的毛色和角的有无两对相对性状分离现象时,用黑色无角牛和红色有角牛杂交,子二代出现黑色无角牛192头,黑色有角牛78头,红色无角牛72头,红色有角牛18头,共360头。试 问这两对性状是否符合孟德尔遗传规律中9331的遗传比例?,7.2.2 对二项分布的检验(P93),检验步骤:(一)提出无效假设与备择假设 H0:实际观察次数之比符合9331的理论比例。HA:实际观察次数之比不符合93
8、31的理论比例。(二)选择计算公式 由于本例的属性类别分类数 k=4:自由 度df=k-1=4-1=31,故计算2。(三)计算理论次数 依据各理论比例9:3:3:1计算理论次数:,黑色无角牛的理论次数T1:3609/16=202.5;黑色有角牛的理论次数T2:3603/16=67.5;红色无角牛的理论次数T3:3603/16=67.5;红色有角牛的理论次数T4:3601/16=22.5。或 T4=360-202.5-67.5-67.5=22.5(四)列表计算2,表 2计算表,=0.5444+1.6333+1.6333+0.9=4.711(五)查临界2值,作出统计推断 当df=3时,20.05(
9、3)=7.81,因 20.05,不能否定H0,表明实际观察次数与理论次数差异不显著,可以认为毛色与角的有无两对性状杂 交 二 代 的 分 离 现 象 符 合 孟 德 尔遗传规律中9331的遗传比例。,例7.1;7.2(P93;94),总体参数未知 例P95,表7-1不同之处:要由样本估计出总体参数。,7.2.3 对正态分布的检验(P96),7.2.4 其他类型问题的检验(P97),一、独立性检验的意义 对次数资料,除进行拟合优度检验外,有时需要分析两类因子是相互独立还是彼此相关。如研究两类药物对实验动物某种疾病治疗效果的好坏,先将动物分为两组,一组用第一种药物治疗,另一组用第二种药物治疗,然后
10、统计每种药物的治愈头数和未治愈头数。,7.3、独立性检验,7.3.1 列联表2 检验(P97),这时需要分析药物种类与疗效是否相关,若两者彼此相关,表明疗效因药物不同而异,即两种药物疗效不相同;若两者相互独立,表明两种药物疗效相同。这种根据次数资料判断两类因子彼此相关或相互独立的假设检验就是独立性检验。独立性检验实际上是基于次数资料对因子间相关性的研究。,独立性检验与拟合优度检验是两种不同的检验方法,除了研究目的不同外,还有以下区别:(一)独立性检验的次数资料是按两因子属性类别进行归组。根据两因子属性类别数的不同而构成22、2c、rc列联表(r 为行因子的属性类别数,c 为 列 因子的属性类别
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 拟合 检验
链接地址:https://www.31ppt.com/p-5357380.html