计数资料的统计描述和统计推断课件.ppt
主要内容,第四章 计数资料的统计描述和统计推断,计数资料的统计描述,抽样与抽样误差,总体率的参数估计,检验,2,4,计数资料的统计描述,例 甲地 麻疹发病人数30人 乙地 麻疹发病人数25人 地区 麻疹发病人数 易感儿童数 麻疹发病(%)甲地 30 3000 1 乙地 25 1000 2.5,常见的数据形式:,绝对数,相对数,但绝对数通常不具有可比性。,强度相对数(率)结构相对数(构成比)相对比,常用的相对数指标:,说明某现象或某事物发生的频率或强度,又称为率(rate)。可用100%(百分率)、1000(千分率)、10000(万分率)、100000(十万分率)来表示。,(一)强度相对数,比例基数的选用一般依据习惯,使计算出来的率的结果保留1-2位整数。,例1 某医院1998年在某城区随机调查了8589例60岁及以上老人,体检发现高血压患者为2823例,求高血压的患病率。,例2 1999年某幼儿园有36名儿童患了腮腺炎,该幼儿园共有200名儿童(其中25名儿童以前患过),求该幼儿园1999年腮腺炎的发病率。,(二)结构相对数,表示事物内部某一部分的个体数与该事物各部分个体数的总和之比,用来说明各构成部分在总体中所占的比重或分布,又称为构成比(constituent ratio)。通常以100%为比例基数。,例1 本班有学生40名,其中男生15名,女生25名。性别构成比:男生性别构成比:15/40100%=37.5%;女生性别构成比:25/40100%=62.5%,例2 1979年昌都5县14个农牧区40岁以上的1468人进行了老年性白内障抽样调查,各年龄组的构成比和患病率见表。,表1 老年人白内障的年龄分布及患病率,白细胞分类计数,构成比的特点和意义,特点:(1)各部分构成比的合计为100%。(2)事物内部某一部分的构成比发生变化,其他部分构成也发生变化。意义:(1)研究事物按一个特征分类,构成比反映事物内部组成的结构特 征,指出工作重点。(2)事物按两个特征分类,构成比反映事物与两个特征的关联关系。,表 某医院1990年和1998年住院病人五种疾病死亡人数和构成比,(三)相对比(relative ratio)是两个相关联的指标之比。说明:(1)式中甲乙两指标可以是绝对数、平均数或相对数;(2)式中甲乙两指标的性质可以相同,也可以是性质不同。,例1 某地某年出生的婴儿中,男性婴儿为484人,女性婴儿为460人,求出生婴儿的性别比。出生婴儿的性别比例为484/460=1.052(或105:100),(四)应用相对数的注意事项(1)正确区分率和构成比,不能用构成比代替率。,(2)观察单位数应足够多,正确的计算合并率应将分子的合计除以分母的合计。,(3)正确计算合并率,(4)注意资料的可比性。,(5)对相对数进行统计推断,例2 1979年昌都5县14个农牧区40岁以上的1468人进行了老年性白内障抽样调查,各年龄组的构成比和患病率见表。,表1 老年人白内障的年龄分布及患病率,(四)应用相对数的注意事项(1)正确区分率和构成比,不能用构成比代替率。,(2)观察单位数应足够多,正确的计算合并率应将分子的合计除以分母的合计。,(3)正确计算合并率,(4)注意资料的可比性。,(5)对相对数进行统计推断,表 某年甲、乙两地儿童传染病发病率,(四)应用相对数的注意事项(1)正确区分率和构成比,不能用构成比代替率。,(2)观察单位数应足够多,正确的计算合并率应将分子的合计除以分母的合计。,(3)正确计算合并率,(4)注意资料的可比性。,(5)对相对数进行统计推断,医学中常用的相对数指标,发病率患病率病死率死亡率死因构成治愈率,计数资料的统计推断,总体,样本,总体参数,样本统计量,抽样,统计推断,参数估计,假设检验,抽样与样本率的抽样误差,在同一个总体中随机抽取样本含量一定的若干样本,计算样本率,各样本率之间往往是不同的,且样本率与总体率之间也有一定的误差,这种由于抽样所造成的样本率之间以及样本率与总体率之间的差别称为样本率的抽样误差。,样本率的标准误与样本含量n的平方根成反比,增加样本含量n可减小样本率的抽样误差。总体率未知,用样本率P作为估计值,即得到样本率标准误的估计值。的估计值。,样本率的抽样误差用样本率的标准误来度量。计算公式:,例 7.6,总体率的参数估计,点估计区间估计,总体率的区间估计,(1)查表法,在样本例数较小,且样本率接近于1或0时,可按照二项分布原理确定总体率的可信区间,但计算繁琐,为方便应用,统计学家根据二项分布原理编制了相应得统计用表,确定总体率的置信区间。(2)正态近似法,当n足够大时,且nP和n(1-P)均大于5时,P的抽样分布近似正态分布。总体率的可信区间,例 7.6 7.7,总体率的假设检验,计量资料:t检验计数资料:检验,检验(chi-square test),检验是一种适用范围非常广泛的假设检验方法,在计数资料分析中可用于两个或两个以上样本率(或构成比)的比较、配对资料的比较以及频数分布资料的拟合优度检验等,在医学科研数据的处理中具有重要的应用价值。,例 某医生用两种疗法治疗前列腺癌,出院后随访三年。甲疗法治疗86例,乙疗法治疗95例,结果见表1。问两种疗法治疗前列腺癌病人的三年生存率是否相同?,一、检验的基本思想,表1 甲乙两种疗法治疗前列腺癌的三年生存率比较,表1中四个格子的数据 是 基本数据,其余的数据都是从这四个数据计算出来的。这种资料称为四格表资料(fourfold table)。(又称22表),H0:12H1:120.05,检验的基本公式为:式中 A为实际频数,T为理论频数,表1 甲乙两种疗法治疗前列腺癌的三年生存率比较,(46.09),(39.91),(50.19),(44.09),(46.09),理论频数T的计算公式为:式中TRC为第R行第C列格子的理论数,nR为第R行的合计频数,nC为第C列的合计频数,n为总例数,检验的基本公式为:,查 界值表,若 0.05(v),P0.05,按0.05水准不拒绝H0,差异无统计学意义。,二、两独立样本率比较的四格表x2检验(一般四格表),(一)基本步骤 以前例为例说明:1、建立检验假设,确定检验水准,H0:1=2,H1:12,0.05,2、计算理论数和 统计量,表1 甲乙两种疗法治疗前列腺癌的三年生存率比较,(46.09),(39.91),(50.19),(44.09),3、确定P值,下结论 查 界值表,0.05(1)=3.84=3.110.05,按0.05水准,不拒绝H0,差异无统计学意义,故尚不能认为甲乙两种疗法治疗前列腺癌的3年生存率有差别。,(二)四格表专用公式,表2 四格表资料的一般形式,表1 甲乙两种疗法治疗前列腺癌的三年生存率比较,(三)四格表资料 检验的运用条件,n 40,T5,(四)不符合 检验的两种情况 1、当n40,1T5,计算校正x2值。,2、当T1或n40时,用Fisher确切概率法。,例(见书),三、配对四格表资料的 检验 配对四格表资料的 检验(test for paired data of fourfold table)是对配对设计研究所获得的计数资料进行比较。,甲 乙1 a2 b3 cN d,表3 两种方法检验结果,例 某研究室用甲乙两种血清学方法检查410例确诊的鼻炎癌患者,结果如表3,问两种检验结果之间有无差别?,表4 两种血清学检验结果,配对资料x2检验的公式:,1、建立假设 H0:B=C,H1:BC,0.052、计算 值,3、确定P值,下结论。查 界值表,0.05(1)=3.84=88.173.84,P0.05,按0.05水准,拒绝H0,接受H1,差异有统计学意义,可以认为甲乙两种血清学阳性检出率不同,甲法的阳性检出率较高。,若bc40,用校正公式,四、行列表资料的 检验 行列表资料(data of RC table)指有两个或两个以上比较的组,记录的观察结果也有两个或两个以上。如多个样本率的比较,两组或多组构成比的比较。,(一)公式和检验步骤,n为总例数,A为每个格子里的实际频数,nR和nC为与A值相应的行和列合计的例数。,例1010,(二)行列表资料进行x2检验的条件 一般认为不能有1/5以上的格子理论频数小于5,或者不能有一个格子的理论数小于1,否则易导致分析偏性。出现这些情况可采取的措施:(1)在可能的情况下增加样本含量;(2)删去上述理论频数太小的行和列;(3)从专业上如果允许,可将太小的理论频数所在的行或列的实际数与性质相近的邻行或邻列中的实际数合并。,