数值变量资料的统计分析.ppt
《数值变量资料的统计分析.ppt》由会员分享,可在线阅读,更多相关《数值变量资料的统计分析.ppt(43页珍藏版)》请在三一办公上搜索。
1、1,第九章 数值变量资料的统计分析,中山大学公共卫生学院医学统计与流行病学系 张晋昕,2,统计描述统计分析 统计推断,3,统计描述统计分析 统计推断,4,表9-1 某地140名健康成年男子的血清尿素氮浓度(nmol/L)资料。,5,表9-1 某地区140名健康成年男性血清尿素氮浓度(nmol/L),6,第一节 数值变量资料的统计描述,【例9-1】某地用随机抽样的方法对140名健康成年男性血清尿素氮(BUN)浓度进行了检测,资料如下,请描述男性血清尿素氮的情况。表9-1的140个数据,无论多认真审视,也说不清这些女孩身高的情况怎样、特征如何统计描述就是解决此问题的方法,即用统计表、统计图和统计指
2、标来描述样本数据的特征,7,表9-1 某地区140名健康成年男性血清尿素氮浓度(nmol/L),8,一、数值变量资料的频数分布,频数(frequency):变量值出现的次数,即例数 频数表(frequency distribution table):反映变量值与频数之间关系的统计表,9,表9-2 某地区140名健康成年男性血清尿素氮浓度(nmol/L)频数表,10,频数表的制作步骤:1.计算极差(range):本例R6.55-2.10=4.45(nmol/L)2.决定组数、组段和组距(取方便数)3列表划记:见表9-2。,11,表9-2 某地区140名健康成年男性血清尿素氮浓度(nmol/L)频
3、数表,12,从频数表可看出有两个重要的特征:集中趋势(central tendency):多数数据向中间集中 离散趋势(tendency of dispersion):少数数据向两端分散,13,(二)频数分布图(直方图)及其制作,频数分布图:反映变量值与频数之间关系的统计图(直方图)。将表9-2资料绘制成频数分布图(图9-1),可见图形中间高两边低、两边对称,认为近似服从正态分布。,14,15,(三)频数表与频数图比较,频数表不够直观,但读出数据精确频数图比较直观,但读出数据不精确,16,(四)分布类型简述,正态分布:图9-1可称为正态或近似正态分布(后述)对数正态分布:指数据的对数值呈正态分
4、布偏态分布:若高峰位于一侧,便被称之为偏态分布(高峰偏左为正偏态,反之为负偏态)分类意义:不同分布类型资料,其描述性统计方法不同(应对号入座),17,图9-2 频数分布逐渐向正态分布接近,18,二、平均水平指标,平均数(average):描述数值变量资料平均水平(或集中趋势)的指标。平均数种类:算术平均数(简称均数)、几何平均数、中位数,另有众数以及调和均数。,19,(一)均数(mean),均数符号:总体均数为(读作mu),样本均数为1直接法计算均数:(9-1)为求和的符号,读作sigma,xi为观察值,n为例数【例9-2】10名女孩的身高(cm)的平均值为 142.2(cm),20,2加权法
5、计算均数 加权法(频数表法)基本思想:以组中值代表组内的变量值(近似法),简化计算 计算:表9-3中fixi=616.80,fi=140,得,(9-2),(nmol/L),21,【注】直接法计算得均数为4.38(nmol/L),可见加权法近似效果很好。,22,(二)几何均数(geometric mean),定义:是将n个观察值x的乘积再开n次方,所得的平方根,记为G 适用情形:(1)观察值呈倍数关系(等比级数资料)或近似倍数关系,如抗体滴度;(2)对数正态资料。,23,1直接法:,24,【例9-3】8份血清的抗体效价为1:200,1:25,1:400,1:800,1:50,1:100,1:50
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数值 变量 资料 统计分析

链接地址:https://www.31ppt.com/p-5269929.html