分类变量资料统计分析.ppt
《分类变量资料统计分析.ppt》由会员分享,可在线阅读,更多相关《分类变量资料统计分析.ppt(71页珍藏版)》请在三一办公上搜索。
1、卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,1,分类变量资料的统计分析,第十章,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,2,主要内容,分类变量资料的统计描述,分类变量资料的统计推断,卡方检验,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,3,什么是分类变量资料?用什么指标进行描述?,甲、乙两地发生麻疹流行,甲地患儿100人,乙地患儿50人,何地较为严重?若甲地易感儿童
2、667人,而乙地易感儿童250人。,甲地麻疹发病率为 100/667100%=15%乙地麻疹发病率为 50/250100%=20%,第一节 分类变量资料的统计描述,用相对数能较好地反映分类变量资料的特征。,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,4,第一节 分类变量资料的统计描述,常用相对数应用相对数时的注意事项率的标准化法,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,5,相对数,相对数:是两个有关联的数值或指标之比。常用的相对数有:率构成
3、比相对比,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,6,率(rate),率:是指在一定观察时间内,某现象实际发生数与可能发生该现象的总数之比,用以说明某现象发生的频率或强度。,K为比例基数,如100%、1000等。比例基数的选择主要依习惯而定或使计算结果能保留12位整数。,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,7,构成比(constituent ratio),构成比:是指事物内部某一部分的观察单位数与事物内部各组成部分的观察单位数总和之
4、比,用以说明事物内部各部分所占的比重或分布。,常用百分数表示,故又称百分比。,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,8,各部分构成比之和为100%。此消彼长。,构成比的两个特点:,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,9,例10-1 2001年对某地中小学学生进行HbsAg检查,结果见表10-1,试计算各级学生HbsAg检出率及阳性者构成比,率和构成比不是同一指标,在应用时应注意加以区分。,卫生学(第7版)第十章 分类变量资料的统计
5、分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,10,相对比,相对比:指两个有关指标之比,说明两个指标的比例关系。,两个指标可以是绝对数、相对数、平均数,可以是性质相同或性质不同,但两个指标互不包含。,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,11,例10-2 某地2003-2005年不同性别新生儿数见表10-2,试计算该地不同年份新生儿性别比。,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,12,应用相对数的注意
6、事项,计算相对数时分母不宜过小 正确区分构成比和率,不能以构成比代替率 正确计算平均率对率和构成比进行比较时,应注意资料的可比性 率的标准化 样本率或构成比进行比较时要作假设检验,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,13,率的标准化,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,14,在进行两个内部构成不同的总率比较时,采用统一的标准进行校正,然后计算校正后的标准化率,再进行比较的方法称为率的标准化法。,率的标准化法,卫生学(第7版)第十
7、章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,15,计算标准化率时,首先要选定一个比较的“标准”。如,对年龄构成进行标化时,可选用全国、全省等大范围人口构成资料作标准,也可将比较组的合并人口或以其中任一组的人口构成作标准。原则上,选定的标准人口应有代表性、较稳定,容易获得,便于比较。根据获得的资料和选定的标准不同,标准化法可分为直接法和间接法。,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,16,直接法,适用情况:已知被标化组各年龄组的实际率Pi,用标准人口数或标准人
8、口构成进行计算。,其中 为第i 组标准人口数,为标准组总人数,为第i 组的实际率,为第组标准人口构成。,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,17,甲社区标准化后的患病率,乙社区标准化后的患病率,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,18,如根据选定的标准人口构成做标准,,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,19,间接法,适用情况:已知被标化组的死亡
9、总数及年龄别人口数,但不知道各年龄组的实际死亡率。,标准化死亡比,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,20,标准化死亡比:被标化组实际死亡数与预期死亡数之比,称为标准化死亡比(standard mortality ratio),简称为SMR。若SMR1,表示被标化人群的死亡率高于标准组;反之,若SMR1,表示被标化人群的死亡率低于标准组。,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,21,例10-4 某地观察了吸烟者与不吸烟者各年龄组人
10、数如表10-6,同时观察期内吸烟者中有432人死于肺癌,不吸烟者中有210人死于肺癌,试计算吸烟者与不吸烟者的标准化死亡率。,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,22,吸烟者的肺癌标准化死亡比,非吸烟者的肺癌标准化死亡比,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,23,吸烟者的肺癌标准化死亡率,非吸烟者的肺癌标准化死亡率,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计
11、分析,24,率的标准化应注意的问题,(1)当各比较组内部构成(如年龄、性别等)不同时,应对率进行标准化后,再作比较。(2)标准化率只表明各标化组率的相对水平,而不代表其实际水平。(3)两总率各分组对应的率有明显交叉时,则不能用标准化率进行比较。(4)如为抽样研究资料,两样本标准化率的比较也应作假设检验。,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,25,第二节 分类变量资料的统计推断,率的抽样分布率的抽样误差与标准误总体率的区间估计率比较的u检验,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料
12、的统计分析7版)第十章 分类变量资料的统计分析,26,率的抽样分布,从某个二项分类总体中随机抽取含量一定的样本,其样本率的分布概率是有规律的,这种规律为服从二项分布(binomial distribution),即样本中阳性数或样本阳性率的分布概率等于二项式展开后各项。若总体阳性率为、样本含量为n,阳性数为X,则样本中出现X个阳性事件的概率可由下式求得。,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,27,已知:=0.5,n=10;=0.3,n=5;=0.3,n=10;=0.3,n=15。试根据式(10-6)求各阳性数事
13、件的概率并作概率分布图。,图10-1 率的抽样分布图,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,28,率的抽样分布特征,1.为离散型分布;2.当=1-时,呈对称分布;3.当n增大时,逐渐逼近正态分布。一般认为,当n和n(1-)5时,可近似看作正态分布。,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,29,率的抽样误差和标准误,由于抽样所引起的样本率和总体率或各样本率之间存在着差异,这种差异称为率的抽样误差。用率的标准误表示。,卫生学(第7版)第
14、十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,30,例10-6 为了解某地人群结核菌素试验阳性率情况,某医疗机构在该地人群中随机检测了1773人,结核菌素试验阳性有682人,阳性率为38.47%,试计算其标准误。,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,31,总体率的区间估计,总体率的估计:点估计区间估计正态近似法查表法,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,32,正态近似法,当
15、样本含量n足够大,样本率p或1-p均不太小时(如np和n(1-p)均大于5),样本率的分布近似正态分布。,u是标准正态分布双侧临界值,在估计总体率的95%置信区间时,其值为1.96;99%置信区间时,其值为2.58。,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,33,95%的置信区间:38.47%1.961.16%=36.20%40.74%99%的置信区间:38.47%2.581.16%=35.48%41.46%,例10-6中该地人群中结核菌素试验阳性率95%和99%的置信区间为:,卫生学(第7版)第十章 分类变量资料
16、的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,34,查表法,当n较小,如n50,特别是p接近于0或1时,按二项分布原理估计总体率的可信区间。因其计算比较复杂,统计学家已经编制了总体率可信区间估计用表,可根据样本含量n和阳性数x查阅统计学专著中的附表。,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,35,u 检验,当样本含量n足够大,样本率p或1-p均不太小时(如np和n(1-p)均大于5),样本率的分布近似正态分布。样本率和总体率之间、两个样本率之间的比较可用u检验(u test)。
17、,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,36,样本率与总体率的比较,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,37,例10-7 一般情况下,直肠癌围术期并发症发生率为30%,现某医院手术治疗了385例直肠癌患者,围术期出现并发症有100例,并发症发生率为26%,问该院直肠癌患者围术期并发症发生率与一般情况比较有无统计学差异。,本例,样本率为26%,np和n(1-p)均大于5,可采用u检验。,卫生学(第7版)第十章 分类变量资料的统计分析
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 分类 变量 资料 统计分析
链接地址:https://www.31ppt.com/p-6095167.html