《计数资料推断》PPT课件.ppt
《《计数资料推断》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《计数资料推断》PPT课件.ppt(72页珍藏版)》请在三一办公上搜索。
1、计数资料的统计推断,第八讲,计数资料统计推断内容,率差或率比的区间估计:u分布,二项分布假设检验:u检验,2检验,一、计数资料假设检验-二项分布直接法及u检验-,(一)单个样本率与已知总体率比较 样本率与总体率的假设检验的目的是推断样本率所代表的未知总体率与已知总体率0(一般指理论值、标准值或经大量观察得到的稳定值)是否相等,其u检验:p为样本率,0为已知总体率,例1、由临床经验得知,一般溃疡病患者的胃出血率为20%,现某医师观察65岁以上溃疡病人250例,其中80例发生胃出血症状(32%),问老年人胃出血率与一般患者是否不同?,u检验应用条件:当n较大,np和n(1-p)均大于5时,中心极限
2、定理-样本率p抽样分布近似正态分布。,H0:=0,即老年人胃出血率与一般患者相同;H1:0,即老年人胃出血率与一般患者不同=0.05,第一步,本例 0=20%,n=250,x=80将数据代入上式:,第二步,P 0.001,按=0.05,拒绝H0,接受H1,可认为老年患者胃出血率与一般患者不同,老年溃疡病患者更容易出现胃出血。老年溃疡病患者出血率的95%可信区间:0.262 0.378 一般出血率:0.20,第三步,(二)两样本率比较u检验目的:是推断两样本所来自两总体率是否相等u检验应用条件:当n较大,np和n(1-p)均大于5时,可利用样本率p的抽样分布近似正态分布.,其u检验公式为:,例2
3、:为比较工人和农民的高血压患病率,分别调查了5059岁男性工人和5059岁男性农民1281人和387人,其高血压患者分别为386人(患病率30.1%)和65人(患病率16.8%)。问工人与农民的高血压患病率有无不同?,H0:1=2,两者高血压患病率相同H1:12,两者高血压患病率不同=0.05,第一步,例 x1=386,n1=1281,p1=30.1%;x2=65,n2=387,p2=16.8%,第二步,P0.001,按=0.05,拒绝H0,接受H1,可认为5059岁男性工人和 5059岁男性农民高血压患病率不同,工人患病率高于农民.率差95%可信区间:0.088-0.178,平均率差为0.1
4、33.(0)对于小样本的率,如何进行假设检验?对于三组以上率或构成比,如何进行假设检验?,第三步,二、计数资料的假设检验-卡方检验-Pearson Chi-square test,KarlPearson,18571936,生卒于伦敦,公认为统计学之父。1879年毕业于剑桥大学数学系;曾参与激进的政治活动,还出版几本文学作品,并且作了三年的实习律师。1884年进入伦敦大学学院,教授数学与力学,从此在该校工作一直到1933年。K Pearson 最重要的学术成就,是为现代统计学打下了坚实基础。KPearson 在1893-1912年间写出18篇在进化论上的数学贡献的文章,而这门“算术”,也就是今日
5、的统计。许多统计名词如标准差,成分分析,卡方检验(1900)都是他提出。,2检验的主要应用,推断两个/两个以上总体率或构成比有无差别;两分类变量间有无相关的假设检验(独立性);拟合优度检验(理论分布与实际分布的吻合情况检验)。,(一)2 检验主要类型,四格表资料的2检验22列联表的2检验RC表资料的2检验,卡方检验基本思想:以四格表资料为例,例4、在二乙基亚硝胺诱发大白鼠鼻咽癌的实验中,一组单纯用亚硝胺向鼻腔灌注,另一组在鼻注的基础上加肌注维生素B12,问两组发癌率有无差别?,表1 两组大白鼠发癌率的比较,2 检验的基本思想,1、建立假设,H0:两组发癌率相等,H1:两组发癌率不等,=0.05
6、,*两组的总体发癌率相等,均等于合并发癌率=91/113=80.5%,为反映所有格子的吻合情况,所有差值求和,(A-T)=0(正负抵消),差值和可定义为(A-T)2;相对比例保持不变,T值越大,(A-T)2值越大,为消除其影响,差值定义为:(A-T)2/T,2、计算统计量2在样本量足够大时,该值服从于自由度为=(行数-1)(列数-1)的2 分布。即2检验公式:2=(A-T)2/T2分布是一簇连续性分布,与自由度有关;在自由度固定时,2值越大,P值越小,反之亦然.在无效假设成立时:2值一般不会很大,出现大的2值的概率P是很小的,若P(检验水准),则没有理由拒绝它。,Pearson Chi-squ
7、are distributions 均值等于自由度,3、P值与2分布,2值反映了实际频数与理论频数的差值大小2值大小与p值呈反比关系,即2 值越大,P值越小;反之亦然。2值达到界值点,就有理由认为成立的可能性不大,是小概率事件,因而拒绝H0。对于四格表资料:0.052=3.84,四格表资料2 检验计算结果,本例2 值=6.48,自由度为1,查2 界值表,得p0.05,按照=0.05的水准,拒绝H0,而接受H1,可认为两组总体发癌率不同,四格表资料的应用条件,当T5,而n40时,选用一般计算公式当140时,需计算校正公式当T1或n40时,选用Fisher确切概率法1934,连续性校正仅用于四格表
8、资料,当超过四个格子时,一般不作Yate校正.,3、率差的区间估计,u检验也能回答两个率是否有差别(或差别有无统计学意义)?,两率比较的可信区间估计(miettinen,woolf)可信区间为,两组率差值(0.196)的95%可信区间为。应用条件:两组np和n(1-p)5,4、率比(RR和OR)区间估计,本资料为临床试验研究,可以同时计算RR与OR值,用以分析Vitb12对发癌危险度的大小,OR1表示Vitb12为危险因素。以OR值为例,OR服从对数正态分布,则有:,实例分析,(二)、2X2列联表(配对设计),1、资料特点与分析目的,资料的特点:配对计数资料分析目的:A:两法检验结果有无关系(
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计数资料推断 计数 资料 推断 PPT 课件
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-5604142.html