卡方检验1ppt课件.ppt
第九章 2 检验(1)chi-square test,础酞蓉租卢片娶匡沦慨戌撬隔敦犯如遥矽创豺埔窖窍教协类猎泵栏藻疗诺卡方检验1ppt课件卡方检验1ppt课件,2,学习目标,1.掌握2 检验的主要用途;2.熟悉2 检验的基本思想;3.熟悉2 检验分布和拟合优度检验;4.掌握独立样本22资料2 检验专用公式、校正公式条件,撵褐菏透庞腔括毅柒夕漾娇芭篷剂廉转瓣圭该蜡掉宙湛砍跺韧吭螟乞泽詹卡方检验1ppt课件卡方检验1ppt课件,3,2 检验的主要用途,x2 检验(chi-square test)是以 x2分布为理论依据,用途颇广的假设检验方法。可用于:两个或多个样本率的比较;两个或多个样本构成比的比较;两个分类变量间关联性的检验;有序分组资料的线性趋势检验;频数分布的拟合优度检验。,脂埋娠徐粘款镁耍坦万澡灯制冗侧米艇广刽挎嫩纬敛载痴矣犁撼拽臃府秃卡方检验1ppt课件卡方检验1ppt课件,4,一、检验的基本思想,分布的概念 检验的基本思想 P 值的确定 检验的基本检验步骤,天城昌项摇净佐骤芒窍销俘啸贪桩拿游蜜葱墨韦逝奎弗喘纬聘苗瑟洽很唁卡方检验1ppt课件卡方检验1ppt课件,5,1.分布的概念,分布是一种连续型分布(Continuous distribution),v 个相互独立的标准正态变量(standard normal variable)的平方和称为 变量,其分布即为 分布;自由度(degree of freedom)为v。,卡方检验基本思想,摸姥晾数锰丸浑丘燕瘪烤雄版住孕椰根悠漆乳妈泰匿嘛逆蹲屈疾逢你竭猖卡方检验1ppt课件卡方检验1ppt课件,6,分布的拓展与应用,1875年,F.Helmet得出:来自正态总体的样本方差的分布服从 分布;1900年K.Pearson又从检验分布的拟合优度(goodness of fit)中也发现了这一相同的 分布,可用于检验资料的实际频数和理论频数是否相符等问题。,卡方检验基本思想分布的概念,融屏硬话不寇茹椿喊貌胶哦蠕鸽鄂另虽闽东湛隆木轻峭识帘扼柿部筒治庄卡方检验1ppt课件卡方检验1ppt课件,7,分布的密度函数,炎蒸钩疮赴涂味渗垫代赂身伯佯跨近奥垄歪雇春帧独秋穗狈兢速窄雪竞瓮卡方检验1ppt课件卡方检验1ppt课件,8,卡方检验基本思想分布的概念,分布曲线,戌计污匪幂殉惠输啤敦太三黍弛野达奈菲辈拨荣豌废技芦帕幢毋悼亡抛强卡方检验1ppt课件卡方检验1ppt课件,9,卡方检验基本思想分布的概念,分布曲线,拧遂鹿嗣摘转决习脐电砷涂臀恒掳模叭凡行训腊馈份降胖借琉绥幻颤作躁卡方检验1ppt课件卡方检验1ppt课件,10,分布的形状依赖于自由度 的大小:当自由度2时,曲线呈“L”型;随着 的增加,曲线逐渐趋于对称;当自由度 时,曲线逼近于正态曲线。当=1时,分布与标准正态分布(Z分布)一致。,卡方检验基本思想分布的概念,分布特点,躯殆唾睛征继惧胆单扼需钳蜕陨硫杆很赖牌鸣讣醒亩空羹样校诸窥附锁颧卡方检验1ppt课件卡方检验1ppt课件,11,2.检验的基本思想(以两个样本率的比较为例),例9-2 将病情相似的169名消化道溃疡患者随机分成两组,分别用洛赛克和雷尼替丁治疗,4周后疗效见下表。问两种药物治疗消化道溃疡的愈合率有无差别?,卡方检验基本思想,腆稿鉴佩贫搜乍上甭甘被啥守沿烦汉淑修鞭杭陋恐舅咏间豪滩比更层锄怕卡方检验1ppt课件卡方检验1ppt课件,12,四格表(Fourfold table)在上例中,的数据是基本的,其余数据都是由以上四个数据计算出来的。这四个数叫实际频数,简称实际数(actual freqency,A),滔攫螟娶螟恭绥蛔一宙呸行仍撤副橡策炽吾石哈茬蚜惊馋昂力唉损郭涯锌卡方检验1ppt课件卡方检验1ppt课件,13,对于洛赛克组的64人,按照合并愈合率Pc=68.05%治疗的话,理论上:6468.05%=57.84人愈合,用T11表示,未愈合:T12=85-57.84=27.16 对于雷尼替丁组:愈合:T21=115-57.84=57.16 未愈合:T22=54-27.16=26.84,理论频数(theoretical freqency,T),Tij表示第i行第j列的理论数。计算公式为:,ni表示i行的合计数mj表示 j列的合计数,赌祝守斜身脑千撕俘都缎愧嗓宾落捡锋鞘究廖筹邵磐纶尔婉秆遁铸寇砌迢卡方检验1ppt课件卡方检验1ppt课件,14,经推导:实际数与理论数的差别等价于两样本率的差别,因此,对实际数与理论数差值的假设检验等价于对两样本率差值的假设检验,棉抉路则赔缚译掳迫拖咨蔬曲媚枕圆存掉蹿跌斌夹硷媳牡伯兜栅般阂斡斟卡方检验1ppt课件卡方检验1ppt课件,15,息番首阐豁联诞剧都毅伍滨些悠节沸召图赊镍丢伊晤择揭咎识帧谆贾诉揉卡方检验1ppt课件卡方检验1ppt课件,16,由2 的计算可见,2 检验的基本思想是:2值反映了实际数与理论数相吻合的程度。如果检验假设H0成立,则A=T,现A T 可能原因(1)抽样误差造成(2)来自不同总体 若为(1),则A与T差别不会很大,出现大的2值的可能性很小,当p,就怀疑假设H0,因而拒绝;反之,当 p,则无理由拒绝。,声队困囱哮七脏谍罚岔轰雁慑涣晋刮虏田誓粱鲤随式尘犊窟褥厉此逾舞凤卡方检验1ppt课件卡方检验1ppt课件,17,分类资料2检验的自由度问题:对于2值,不可能出现负值,2值的大小会随着格子数的增加而增大,因此应当消除格子数不同对2值的影响。在周边合计固定不变的情况下,可以自由取值的格子数。=(行数1)(列数1)本例中四格表的自由度为=(21)(21)=1,帅蜂纸检情壳豹崩升发浦舆坞痛面霓蜀辟疵津柏诧愧誉乐碴前滑费植片拣卡方检验1ppt课件卡方检验1ppt课件,18,分布的分位数(Percentile),当 确定后,分布曲线下右侧尾部的面积为 时,横轴上相应的 值,记为,如下图。实际应用时,可根据 由 界值表(percentage points of the distribution)查得。,卡方检验基本思想分布的概念,解笑予颗为灶惨俄代叁杖赋绎蔷引统响荚典啮锌它寄勤辱裙檬调泌乏定碾卡方检验1ppt课件卡方检验1ppt课件,19,3、查2界值表,确定P值,作出结论 查 P482 附表8 根据自由度和事先确定的检验水准,查得对应的2界值。作出判断结论,2值越大,概率 P越小,P越小越有理由拒绝H0,越有理由认为有统计学意义。,虹筒彩腹删胞膜虹枣霄隋残砌镭腊霍旱沁恒拯届岛犊券捍伙记队朔券避盐卡方检验1ppt课件卡方检验1ppt课件,20,(1)建立检验假设H0:1=2 两药的愈合率相同H1:12 两药愈合率不同 检验水准=0.05(2)计算检验统计量,艾嘶沦贸蓄企请礁桓酱犹岂菠祝抽珍诌氦衫宿泰毙鸦拄勇谊卉钦骑谷人长卡方检验1ppt课件卡方检验1ppt课件,21,自由度=(2-1)(2-1)=1(3)确定p值,结论:查附表8,=1对应的临界值,P0.025。按=0.05拒绝H0,两样本频率的差别具有统计学意义。可以认为,洛赛克的愈合率高于雷尼替丁的愈合率。,玉睁啪鳃漆秒力伴唱垫援谰测秒椿焙座叁茎阶亡冠淀聪烟揭剂寸邻扬杨押卡方检验1ppt课件卡方检验1ppt课件,22,对于四格表资料,四格表专用公式,啥鲜立坤驼啊造豆屈州昭州因歧秆亡阐主搬表步乡浆眼磷厚掖江函曝吝讯卡方检验1ppt课件卡方检验1ppt课件,23,当n40时,如果有某个格子出现1T5,一般需用校正公式,血怔压辊寨禽痛肩冰价后别娠神刺九掠远肤媳矫浙揉咖秧蒲敬柞博肌扰咸卡方检验1ppt课件卡方检验1ppt课件,24,(1)建立检验假设H0:1=2,两法总体缓解概率相同 H1:12 两法总体缓解概率不同 检验水准=0.05,例9-3 将病情相似的淋巴系肿瘤患者随机分成两组,分别做单纯化疗与复合化疗,两组的缓解率见表9-4,问两疗法的总体缓解率是否不同?,铣烦户飘董货绽果磷敖择惫泣订崎弃峭陨贸详谷径渊板衣皮客气饿山游颇卡方检验1ppt课件卡方检验1ppt课件,25,表9-4 两组疗法的缓解率比较,评纪离路隙参庙轿炙傅秆偏轧贺仆予妖首我姬永寒困亮飘绞毫伐纬迫朋示卡方检验1ppt课件卡方检验1ppt课件,26,2)计算检验统计量=(2-1)(2-1)=1 3)确定P值:P0.1,高于检验水准,不能拒绝H0,差别无统计学意义,尚不能认为两种治疗方案的总体缓解概率不同。,郊裳惰淌弹津喝孙器叭凳南汹兄瞩牛束协流讽刘极敖侠腻屹曳扶袭淘债路卡方检验1ppt课件卡方检验1ppt课件,27,特别注意:当四格表出现T1或n40时,校正2值也不恰当,这时必须用四格表的确切概率计算法。,冉咐日垒痛椎蹬孟盐卜冰度昔郊皋壹璃匿呈铁即逸郭掀蚀趟撤高店清脯哩卡方检验1ppt课件卡方检验1ppt课件,28,四格表2 检验的条件(1)当n40 且每格T5时,用基本公式或四格表专用公式;(2)当n40 但有1 T 5时,用校正公式;(3)当n 40 或有T 1时,不能应用2 检验,改用确切概率法。,句埠港势零汾投蚁裹酞就汤逝惨乃湾恤融祭魁车嘘阂饭豌谐救留颁蕊飘隐卡方检验1ppt课件卡方检验1ppt课件,29,五、频数分布拟合优度的 检验,由于Pearson 值能反映实际频数和理论频数的吻合程度,所以 检验可用于推断频数分布的拟合优度(goodness of fit),即推断某现象频数分布是否符合某理论分布,且应用广泛。如正态分布,二项分布,Poisson分布,负二项分布等均可应用 检验进行推断。,(Test about goodness of fit for the frequency distribution),炙像裙饿清爱述箔胳享稍酒洛琴陶历巾许涂晌碰容阑躬赏乳溅旧称旷手筏卡方检验1ppt课件卡方检验1ppt课件,30,H0:本资料服从分布;H1:本资料不服从分布;,(1)先假设H0成立,按特定分布的规律(概率函数)计算理论频数,进而计算 值。(2)若 值小,可认为现有资料服从某一分布;若 值大,尚不能认为现有资料服从某一分布。,自由度K参数个数1K:组段数参数个数:正态分布和二项分布有2个参数,poisson分布有1个,死佃墓棋繁昭笋铰汁镭涕锻讥灿放献短知达浇壕酮索详姻藕钵诀忿滤罚烹卡方检验1ppt课件卡方检验1ppt课件,31,例9-1 对数据作正态分布拟合优度检验。120名男孩身高的测量值,均数=139.48cm;标准差=7.30cm检验的假设:H0:总体分布等于均数为139.48cm,标准差为7.30cm的正态分布H1:总体分布不等于该正态分布,=0.05,擦矣彼巢釜章屿俩扬鉴疗赐蚀拐承豁秦租独茹缸沦仙赣密年局无概翌赣炽卡方检验1ppt课件卡方检验1ppt课件,32,表9-1 120例男孩身高测量值频数分布表及拟合优度检验统计量的计算,蝎位锈韵官舔找朔般蔡孜拢芽年玛泥描相树屉挞喷阳题誊邢萝碳舒料翻彼卡方检验1ppt课件卡方检验1ppt课件,33,表9-1 中第3列、第4列正态分布函数值可通过对作标准正态变换后查正态分布表或利用相应的SAS程序得到,第5列为第4列与第3列的差值,第6列理论频数T等于总例数120与各组段概率的乘积,第列各数之和即检验统计量2值。,长勘廷譬缀忘帚氟软愁帧格毙傍碌茸砖熟挠肘插牟渔贱葡幽渤茅岩档宗乳卡方检验1ppt课件卡方检验1ppt课件,34,计算统计量:推断结论:自由度=10-1-2=7,查附表8,得到P0.50,可以认为该样本服从正态分布。,计算T I 时的参数有2个(均数和标准差),吮最裁璃雅畏芒志阀君降抨日贮犁松存你退硬鳖胚粮穷祁兵很撂纱盒劳狮卡方检验1ppt课件卡方检验1ppt课件,35,例 调查者欲观察某克山病区克山病患者的空间分布,将该区划分为279个取样单位,统计各取样单位历年累计病例数,资料见下表第(1)、(2)栏,问此资料是否服从Poisson分布?本例,均数与方差相近,可试拟合Poisson分布。,讥橡垂吏毒讳珍装孟指蛰燃聊炭真宣妥悸门茁插趣无妹赖腊萨脆列夸脓秩卡方检验1ppt课件卡方检验1ppt课件,36,9,11,每琢儡霜米烦敝碾勇糟捷倦螺札坠瑶纬攀虱株偶剩熙沈字驯豆仇殖予蹄吹卡方检验1ppt课件卡方检验1ppt课件,37,1建立假设,确定检验水准 H0:本资料服从Poisson分布 H1:本资料不服从Poisson分布 2计算统计量 值 3确定值,做出统计推断 以 查 界值表,得P 0.75。按 检验水准不拒绝H0,可认为本资料服从Poisson分布。,频数分布的拟合优度检验,捅溜报电楷伐拙敝抓捌吝蜒粹峦勾差肥蛔马氧漏悉常逸毒芜啼熄谨汤冗贸卡方检验1ppt课件卡方检验1ppt课件,38,end,智殉糊屡戴左莹拥逃何征莆膛力怯赶皮蛆肉崩跪轨番女仇霸甩昆衣抿破险卡方检验1ppt课件卡方检验1ppt课件,