第五讲-计数资料的统计描述-课件.ppt
计数资料的统计描述,复习,统计描述,集中趋势:算术均数、几何均数、中位数,离散趋势:极差、四分位间距、方差、标准差、变异系数,统计推断,参数估计,假设检验,点估计,区间估计:注意与参考值范围的区别和各自的应用,单个资料的t检验,配对资料的t检验,成组资料的t检验,多组资料方差分析,注意假设检验的基本思想和注意事项,计量资料,统计描述,相对数:率、构成比、相对比,统计推断,计数资料,参数估计:点估计和区间估计,假设检验:检验,第一节 相对数(Relative number),相对数的概念:两个有联系的(数值)指标之比。相对数的种类:比:1.构成比 2.相对比3.率,1.率(Rate),概念:也称频率指标,全体观察单位中某种现象发生的频率或强度。计算公式:发生某种现象的观察单位数 可能发生某种现象的观察单位数 K:100%(1000)例如:发病率、患病率、死亡率、病死率等。注意:不受其它指标的影响;各率相互独立,其之和不为1(如是则属巧合);,K,某地某年四种常见心血管病死亡率,2.构成比(Proportion),概念:也叫构成指标,是指某一事物内部各组成部分所占的比重或分布。计算公式:某一组成部分的观察单位数 同一事物各组成部分的观察单位总数例如:疾病和死亡顺位等注意:各组成部分的构成比之和为100%某一部分比重增大,则其它部分相应减少。,100%,某地1992年护理人员学历构成,构成比与率的区别,构成比各构成部分比重之和应为100%,某已构成部分的增减会影响其他部分构成比相应减少或增加而某一部分率的变化并不影响其他部分的率,且其平均率不能简单地将其各率相加后平均求得 P=(x1+x2+x3)/(n1+n2+n3)正确 P=(P1+P2+P3)/3 错误,3.相对比(Ratio),概念:是指两个有联系的指标之比,描述二者的相对水平,是对比的最简单形式。计算公式:A、B两个指标,A/B(或100%)若干倍或百分之几。例如:性别比、CV、相对危险度(RR)等。注意:A、B性质可以相同,也可以不同,第二节 应用相对数时的注意事项,1、分析时不能以(构成)比代(替)率2、计算相对数时分母不能太小3、总率(平均率)的计算:不能直接相加求和4、资料的可比性:两个率要在相同的条件下进行.研究方法相同、研究对象同质、观察时间相等、地区、民族、年龄、性别等。5、样本资料的比较应作假设检验,第三节 标准化法,什么是标准化?为什么要进行标(准)化?内部结构不同的两组对象进行比较:例如A组病情严重者多,B组病情较轻的多,但要比较两种不同方法的治疗效果,结果会怎样?,两种疗法疗效比较,从表中的合计看,新疗法的治愈率比旧疗法高。但分别观察成人组和儿童组的治愈率相同。其合计的差别之所以大,是由于两种疗法的选择的样本人群年龄构成不同。新疗法成人所占比例高,而成人的治愈率高,造成总率较旧法高。要正确比较两法的疗效,需按照统一标准进行校正,然后进行比较。,标准化的原因:当两组资料进行比较时,如果其内部不同小组率有明显差别,而且各小组内部构成也明显不同,直接比较不合理,需要进行标准化后再进行比较。标准化的思想:按照统一标准进行校正,以消除由于构成不同对总率的影响,使算得的标化率有可比性。,标准化法(Standardization method),标准化率的计算,1.选择标准:任意一组、两组之和、有代表性的人口2.计算标准化率p:直接法:已知标准组年龄别人口数时:p=Ni pi/N 已知标准组年龄别人口构成时:p=(Ni/N)pi 间接法:p=P r/ni pi=P SMRSMR:标准化死亡比,是对原总死亡率的校正,新旧两种疗法的标准化治预率,注意事项,1.标准不同得到的标化值不同2.内部各小组比较时,可不标化3.标化后的数值不再反映实际水平,小 结,构成比相对比率标准化:标准化法的目的是消除混杂因素对结果的影响重点和难点:以比代率和标准化问题,两地总死亡率比较 结合专业知识考虑有混杂因素(如年龄)无 同 年龄与死亡率有关?两地人口年龄构成相同?有 不同 已知条件(1)两地各年龄组死亡率pi(无明显交叉)(1)两地各年龄组人数ni及死亡总数r(2)标准组各年龄组人数Ni或构成比Ni/N(2)标准组各年龄组死亡率pi 及总死亡率P 直接法:标化率p=间接法:SMR=,标化率p,标准化思路图,第四节 二项分布及其应用,二项分布是一种离散型的概率分布是指在只能产生两种可能结果之一如阳性、阴性的n次独立重复实验中,当每次实验的阳性概率保持不变时,出现阳性的次数,x=0,1,2n的一种概率分布 B(n,)概率函数:,二项分布的条件,每次实验结果只能是两个互斥结果之一相同的实验条件下,每次实验中事件A的发生具有相同的概率(非A概率为1-)各次实验独立,实验结果互不影响,二项分布图形与正态近似性,二项分布图取决于n和,高峰在=n 处当接近0.5时,图形呈对称分布,当越远离0.5时,越不对称当n,只要不太靠近0或1,(特别是当nP和n(1-P)都大于5时),二项分布近似于正态分布,二项分布图形,第五节 率的抽样误差与可信区间,一、率的抽样误差与标准误 二、总体率的可信区间,一、率的抽样误差与标准误,从总体率为的二项分布总体中随机抽取样本含量为n的样本,其阳性观察结果x以p=x/n表示,抽样误差大小为:,如果总体率未知,用样本率p估计,标准误的计算,二、总体率的可信区间,1.正态分布法;,当n足够大,且n p 和n(1-p)均大于5时,p的抽样分布逼近正态分布。其可信区间为:双侧:(p-Z/2 Sp,p+Z/2 Sp)(Z0.05/2=1.96)单侧:p-Z Sp 或 p+Z Sp(Z0.05=1.645),如例6-1的p=0.1410,Sp=0.0125,该例的总体率双侧95%可信区间为(0.1410-1.960.0125,0.1410+1.960.0125)=(0.1165,0.1655)即该地4060岁成年男子高血压总体患病率的95%可信区间为11.65%16.55%。注意:如果计算获得的可信区间下限小于0%,上限大于100%,则将下限直接定为0%,上限直接定为100%。,2.查表法,n50,且p接近0或1的资料时采用例6-2某新药的毒理研究中,用20只小白鼠作急性毒性实验,死亡3只,估计该药急性致死率的95%可信区间。从附表7(根据二项分布原理制成)查得,在n=20与X=3纵列交叉处的数值为3 38,即该药急性致死率的95%可信区间为3%38%。,