卫生学 9. 数值变量的统计分析课件.ppt
《卫生学 9. 数值变量的统计分析课件.ppt》由会员分享,可在线阅读,更多相关《卫生学 9. 数值变量的统计分析课件.ppt(106页珍藏版)》请在三一办公上搜索。
1、第九章 数值变量资料的统计分析,预防医学教研室郭怀兰,数值变量资料的统计分析,集中趋势统计描述 离散趋势 统计推断,参数估计假设检验,内 容,数值变量资料的统计描述正态分布及其应用数值变量资料的统计推断,目的和要求,掌握 1 频数分布表及其主要作用 2 描述数据分布集中趋势和离散趋势的指标; 3 正态分布的概念和特征、标准正态分布下面 积分布规律熟悉 1 连续性变量的频数分布图,医学参考值范围的意义和计算方法; 2 正态分布表、正态分布的应用。了解 如何应用正态分布函数。,第一节 数值变量资料的统计描述,内容,数值变量资料的频数分布,1,集中趋势指标,2,离散趋势指标,3,正态分布和医学参考值
2、范围,4,案例,2007年9月份我室对我校2005级临床本科的1、2、3大班全体学生490人的个人情况(姓名、性别、年龄、身高、体重、吸烟、饮酒等)进行了调查,下面是调查资料问:(1)各变量是什么类型的变量?(2)如何描述2005级临本身高、体重?,一、数值变量资料的频数分布,例9-1 某地140名健康成人男性尿素氮(BUN)浓度测定值资料如下:6.005.28 2.10 6.55 ,1、计算极差(range,R) :R6.55-2.10=4.452、确定组数(K)、组段和组距:组数:取1015之间,样本含量较大时,组段数多一些,反之,可少一点。组距可以相等也可以不相等,根据资料的特征而定,分
3、组原则是以能够反映出资料的分布规律为准。,编制频数分布表步骤,年龄(岁)患者人数每岁人数 年龄(岁)患者人数每岁人数0 33 8 8 8 1 33 9 9 92 99 10 36 3.63 11 11 20 13 1.3 4 23 23 30 11 1.1 5 22 22 40 4 0.4 6 11 11 50 1 0.1 7 14 14,不等距离,1953年某市流行性乙型脑炎患者年龄分布,编制频数分布表步骤,组距:R/k4.45/12=0.370.4 确定组段:第一组要包含最小值,最后一组要包含最大值。3、列表划记,表9-2 140健康成年男性血清尿素氮浓度(mmol/L) 尿素氮浓度 划
4、记 频 数2.00| | 2 2.40正| | 72.80正正| | | 133.20正正| | | | 143.60正正正 154.00正正正| | | | 194.40正正正| | | 184.80正正正| 165.20正正| | | | 14 5.60 正正| | | 13 6.00 正| 6 6.40 6.80 | | | 3合 计 140,频数分布表的用途,偏态分布,正态分布,分布类型,频数分布表的用途,红细胞数划 记频 数 (1) (2) (3)3.70| | 2 3.90| | | | 44.10正 | | | | 94.30正正正 | 164.50正正正正 | | 224.70
5、正正正正正 254.90正正正正 | 215.10正正正 | | 175.30正 | | | | 95.50| | | | 45.705.90| 1合 计 130,某地区130名正常成年男子红细胞数(1012/L)的频数分布,某地100名20周岁应征男青年的身高频数分布,238名正常人发汞值(g/g) 的中位数和百分位数的频数表计算发 汞 值 频 数 累计频数 累计频率(%) (1) (2)(3) (4)=(3)/238 0.3 20 20 8.4 0.7 6686 36.1 1.1 60 146 61.3 1.5 48 194 81.5 1.9 18 212 89.1 2.3 16 228
6、95.8 2.7 6 234 98.3 3.1 1 235 98.7 3.5 0 235 98.7 3.94.3 3 238 100.0,正偏态分布,某地某年恶性肿瘤死亡数的年龄分布年龄组 恶性肿瘤死亡数 0 1 10 12 20 15 30 76 40 189 50 234 60 386 70 286,负偏态分布,分布特征,集中趋势(central tendency),离散趋势tendency of dispersion,分布特征,二、集中趋势的描述,描述数值变量资料的集中趋势,常用的指标是平均数(average)。平均数可用来反映一组性质相同的观察值的集中趋势、中心位置或平均水平。平均数包
7、括算术均数、几何均数、中位数、众数及调和均数等,是统计学中应用最广泛、最重要的指标体系。,(一)算术平均数 arithmetic mean,算术平均数的计算,1)直接法 将所有数据 直接相加,再除以总例数n,即:,例9-2 10名女孩身高,2)加权法当资料有较多相同观察值时,可用相同观察值的个数(即频数)乘以该观察值,以代替逐个相加。即:,表9-3 140名成年男子血清BUN浓度均数与标准差计算表,根据表9-2,用加权法求某地健康成人男性BUN(mmol/L)测定值均数如下: 由频数表求得的均数与直接由原始数据求得的均数稍有出入。,二、几何均数 geometic mean,对所有数据直接相乘,
8、再开n次根,即:,式中为连乘符号,xi为各观察值的大小。对公式两边取对数:,1)直接法,例9-3 设有8份血清抗体滴度为1:200,1:25,1:400,1:800,1:50,1:100,1:50、1:25,求平均滴度。,当资料由较多的观察值或频数表资料时,可用加权法求得几何均数。,式中fk为xk的频数。,2)加权法,表9-4 某地112名儿童接种疫苗后血清抗体滴度的计算表,应用G时注意事项,计算几何均数时,观察值中不能有0,因为0不能与其他任何数值呈倍数关系观察值中不能同时有正值和负值。若全是负值,计算时可先将负号除去,得出结果后再加上负号同一资料而言,若同时计算G与 ,则理论上可以证明G,
9、WARNING,三、中位数 Median,2)计算方法 1)直接法 当例数较小时,可将观察值按从小到大的顺序排列,直接求得M。,当n为奇数时,当n为偶数时,例9-6 某传染病11名患者的潜伏期分别为:1、2、2、3、3、4、5、6、7、7、9,求其中位数。本例中,n=11为奇数,且数据已经按照从小到大的顺序排列:,百分位数 ( Percentile,Px ),描述变量值序列在某百分位位置的水平,多个百分位数结合可更全面地描述变量值的分布特征。,把一组数据从小到大排列,数据数目分成100等份,各等份含1%的观察值,分割界限上的数值就是百分位数。,百分位数的计算方法:,例9-7 为了解某地儿童体内
10、铅负荷现状,某市儿保所2006年以随机抽样的方法调查了该市340名7岁以下儿童的血铅含量,求其中位数、P25、P75、P95。,表9-5 340名7岁以下儿童的血铅含量频数表潜伏期(天) 人数f 累计频数 累计频率% 0.00 22 22 6.47 0.25 36 58 17.06 0.50 23 81 23.82 0.75 42 123 36.18 1.00 41 164 48.24 1.25 55 219 64.41 1.50 36 255 75.00 1.75 28 283 83.24 2.00 15 298 87.65 2.25 24 322 94.71 2.50 6 328 96.4
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 卫生学 9. 数值变量的统计分析课件 数值 变量 统计分析 课件
链接地址:https://www.31ppt.com/p-1406190.html