分类变量资料统计分析讲义课件.ppt
《分类变量资料统计分析讲义课件.ppt》由会员分享,可在线阅读,更多相关《分类变量资料统计分析讲义课件.ppt(110页珍藏版)》请在三一办公上搜索。
1、第十六章 分类变量的统计分析第1-3节 统计描述,刘颖 预防医学教研室,掌握: 常用相对数指标的意义、计算方法和注意事项; 率的标准误和总体率可信区间的估计方法及意义; u 检验和 检验的适用条件和计算方法。,熟悉: 率的标准化的意义和计算方法,第一节 常用相对数,绝对数(absolute number)分类变量资料整理后所得到的数据。相对数(relative number)分类变量资料的统计描述指标。,例1 某年某地流行性乙型脑炎发病 240 例、麻疹发病 200 例。240、200 绝对数绝对数说明在一定条件下该地该病实际发生的绝对水平,是制订疾病防治计划和统计分析的基础。,甲地麻疹发病率
2、 = 240 / 2000 = 12%乙地麻疹发病率 = 200 / 1000 = 20%,例2,常用相对数,1. 率(rate)又称频率指标或强度指标; 说明某现象发生的频率或强度; 常以 %、1 / 万、1 / 10万等表示。,例3 某年某市三个区的肠道传染病发病率区 人口数 发病人数 发病率()甲 98740 503 5.09乙 75135 264 3.51丙 118730 466 3.92合计 292605 1233 4.21,甲区发病率 = 503 / 98740 = 5.09,总发病率 = 1233 / 292605 = 4.21,2. 构成比 (constituent ratio
3、),又称构成指标或结构指标,说明某一事物内部各组成部分的比重或分布,常以百分数表示。,某一组成部分的观察单位数,100%,表16.1 2000年某医院某病住院与死亡人数病情严重程度 住院人数 病死数 死亡构成(%) 病死率(%) 轻 300 12 26.7 4.0 中 350 18 40.0 5.1 重 150 15 33.3 10.0 合计 800 45 100.0 5.6,构成比的特点,各构成部分的构成比总和为100% ; 某一部分所占比重的增减,会相应地影响其他部分,各构成比之间是相互制约的 。,3. 相对比(relative ratio ),表示两个有关指标之比,常以倍数或百分数表示。
4、,(或100%),例5 2000 年我国第五次人口普查结果,男 65355 万人,女子 61228 万人,试计算人口男女性别比。,例6 某市乙型脑炎的发病率 1990 年为 4.48/10 万,2000 年为 0.88 / 10 万,试计算相对比。 相对比 = 4.48 / 0.88 = 5.1(倍) 相对比 = 0.88 / 4.48100% = 19.64%,例16.3 甲、乙两地肺癌死亡率分别为23.1/10万、12.33/10万,则两地死亡率的相对比为23.1/12.33=1.87,即甲地肺癌死亡率是乙地的1.87倍,RR= 1.87。,计算相对数时分母不宜过小,即观察单位数应足够多。
5、 分析时构成比和率不能混淆(见表16-1)构成比说明事物内部各组成部分的比重或分布; 率说明现象发生的频率或强度。,第二节 应用相对数的注意事项,表16.1 2000年某医院某病住院与死亡人数病情严重程度 住院人数 病死数 死亡构成(%) 病死率(%) 轻 300 12 26.7 4.0 中 350 18 40.0 5.1 重 150 15 33.3 10.0 合计 800 45 100.0 5.6,相对数的比较应注意可比性 观察对象同质、研究方法相同、观察时间相等,以及客观条件一致; 资料内部构成是否相同。,率的标准化 要考虑存在抽样误差 率或构成比的比较应做假设检验,第三节 率的标准化法,
6、率的标准化法(standardization)在一个指定的标准构成条件下进行率的对比的方法。 实际工作中,对两个或多个频率指标进行比较时,若各组对象内部构成存在差异,且差异又影响分析结果,应该用率的标准化法进行比较。,表16.2 甲、乙两医院的治愈率,科别 住院人数 治愈人数 治愈率(%) 甲医院 乙医院 甲医院 乙医院 甲医院 乙医院 内科 1500 500 975 315 65.0 63.0 外科 500 1500 470 1365 94.0 91.0传染病科 500 500 475 460 95.0 92.0 合计 2500 2500 1920 2140 76.8 85.6,1.用“标准
7、人口”计算(1)选定标准:两医院各型病人相加;标准的选择方法:选择有代表性、较稳定、数量较大的人群,如全 国、全省的历年累计数据;在互相比较的两组资料中,任选其中一组或两组 合并作为共同标准。,标准化率的计算(直接法),(2)计算甲、乙两医院各型传染病病人的预期治愈人数:各型病人标准人口数分别乘以相应的原治愈率;(3)计算甲、乙两医院传染病的标准化治愈率:各型病人预期治愈人数相加除以标准总人数。,表16.3 标准人口数计算甲、乙两医院标准化治愈率(直接法),科别 标准人 原治愈率(%) 预期治愈人数 口数 甲医院 乙医院 甲医院 乙医院 内科 2000 65.0 63.0 1300 1260
8、外科 2000 94.0 91.0 1880 1820传染病科 1000 95.0 92.0 950 920合计 5000 76.8 85.6 4130 4000,乙医院标化治愈率=乙医院预期治愈人数之和/标准组总人数 =4000/5000*100%=80%,2. 用“标准人口构成比”计算,(1)将标准病人数换算成构成比;(2)计算甲、乙两医院各型传染病的分配治愈率: 标准人口构成比乘以相应原治愈率;(3)计算甲、乙两医院某传染病的标准化治愈率: 各型传染病分配治愈率相加。,表16.4 标准人口构成比计算甲、乙两医院标准化治愈率,科别 标准人口 原治愈率(%) 预期治愈率 构成比 甲医院 乙医
9、院 甲医院 乙医院 内科 0.4 65.0 63.0 26.0 25.2 外科 0.4 94.0 91.0 37.6 36.4传染病科 0.2 95.0 92.0 19.0 18.4合计 1.0 76.8 85.6 82.6 80.0,应用标准化法时的注意事项,当各比较组内部构成不同,并足以影响总率的比较时,应对率进行标准化后再作比较; 率的标准化的目的是消除混杂因素影响,使其具可比性;,各年龄组对应的率出现明显交叉时,宜分别比较各年龄组死亡率,而不用标准化进行比较; 如是抽样研究,两样本标准化率的比较应作假设检验。,标准化率已不能反映率的实际水平,它 只能表明相互比较资料间的相对水平; 选定
10、的标准构成不同,所得的标准化率 也不同,仅限于采用共同标准构成的组 间比较。,第十六章 分类变量的统计分析第4-6节 统计推断,刘 颖预防医学教研室,一、率的抽样误差和标准误 率的抽样误差的大小用率的标准误表示。,第四节率的抽样误差和总体率的估计,例16.5 欲了解某种新药对慢性乙型肝炎的疗效,对100名患者进行治疗,其中90人有效,试计算其标准误。,一、正态近似法适用条件:np 和 n(1-p) 5 时,可根据近似正态分布 的原理估计其可信区间。例16.5 试求该新药有效率的95%可信区间?,二、总体率的可信区间估计,二、查表法 适用条件:n 50 ,特别是 p 接近 0 或 1 时,此时资
11、料呈二项分布,可按二项分布的原理估计总体率的可信区间。,一、样本率与总体率比较的u 检验目的:推断样本率与总体率的差异是否仅由抽样所 致,其差异是否有统计学意义。总体率:一般是理论值、标准值或是经过大量观察 所得的稳定值。,第五节率的 u 检验,其中: 为样本率 为总体率 n 为样本含量,例16.7 某地区一般人群中乙型肝炎的阳性率为15%,现对该地区150名流浪者进行检查,其中阳性30人,问当地流浪者的阳性率是否高于一般人群的阳性率?,本例样本率为50%,np 和 n(1-p) 5 时,可认为呈近似正态分布,故可采用 u 检验。检验假设H0 : ,当地流浪者阳性率与一般人群相同H1: ,当地
12、流浪者阳性率高于一般人群单侧,计算 u 值 确定 P 值 ,下结论 u = 1.715 1.645,P 0.05,按a=0.05的检验水准,拒绝H0,接受H1,认为当地流浪者的阳性率高于一般人群。,目的:推断两样本率是否来自同一总体。适用条件:样本率符合近似正态分布的条件(n 较大,且 P 和 1-P 不太小,即 np 和 n(1-p)5时),可用率的 u 检验。,二、两样本率比较的 u 检验,式中: 、 为样本率,n1、n2为样本例数, X1、X2为阳性例数, 为两样本合并率。,例16.8 欲了解从事工农业生产的50岁以上人群高血压的情况,调查了首钢工人1281人,高血压患者386人,患病率
13、为30.13%;石景山区农民387人,高血压患者65人,患病率为16.80%,试问从事工农业生产的50岁以上人群高血压患病率有无差别?,本例两样本的乙肝携带人数均大于5,故可采用样本率的 u 检验。建立检验假设 H0 : H1:,计算 u 值,3. 确定 P 值 ,下结论 u = 5.17 1.96,P 0.05,按 a=0.05 的检验水准,拒绝H0,接受H1,从事工业生产和农业生产的50岁以上人群高血压患病率不同。,第六节 检验,检验(chi - square test)适用于: 分类变量资料中两个或多个样本的总体率是否相同,两个或多个样本的构成比是否相同,配对资料两种属性间的阳性率是否相
14、等。,(一)四格表的 检验基本思想 可用于两样本率的比较 表16-7 四格表 检验的基本结构,一、四格表的 检验,处理 发生数 未发生数 合计 A组 a b a + b B组 c d c + d 合计 a + c b + d n,上表中第 R 行、第 C 列的理论频数为:因此:,如果四格表中实际的发生数用 A 来表示,可通过下式计算 值:,基本思想:实际频数与理论频数吻合程度。 在检验假设成立的情况下, A 与 T 之差一般不会很大,此时 值也较小;反之, 值较大。 检验的自由度:v = (行数 - 1)(列数 - 1),例16.9 某医生欲比较A、B两种药物治疗老年期抑郁症的效果,将病情相近
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 分类 变量 资料 统计分析 讲义 课件
链接地址:https://www.31ppt.com/p-1605992.html