《医学统计学》完全版ppt课件.ppt
《《医学统计学》完全版ppt课件.ppt》由会员分享,可在线阅读,更多相关《《医学统计学》完全版ppt课件.ppt(653页珍藏版)》请在三一办公上搜索。
1、医学本科生用医 学 统 计 学,主讲 王守英,新乡医学院公共卫生学系综合实验室,第1章绪论,第1页 共654页,医学统计学总目录,第1章绪论,第2章定量资料统计描述,第3章总体均数的区间估计和假设检验,第4章方差分析,第5章定性资料的统计描述,第6章总体率的区间估计和假设检验,第7章二项分布与泊松分布,第8章秩和检验,第9章直线相关与回归,第10章实验设计,第11章调查设计,第12章统计表与统计图,第1章绪论,第2页 共654页,第1章绪论 目录,第五节 学习统计学应注意的几个问题,第二节 统计工作的基本步骤,第三节 统计资料的类型,第四节 统计学中的几个基本概念,第一节 医学统计学的定义和内
2、容,第1章绪论,第3页 共654页,第一章 绪论第一节 医学统计学的定义和内容,医学统计学(medical statistics) -是以医学理论为指导,运用数理统计学的原理和方法研究医学资料的搜集、整理与分析,从而掌握事物内在客观规律的一门学科。,第1章绪论,第4页 共654页,医学研究的对象-主要是人以及与其健康有关的各种影响因素。医学统计学的主要内容 :1.统计设计 包括实验设计和调查设计,它可以合理地、科学地安排实验和调查工作,使之能较少地花费人力、物力和时间,取得较满意和可靠的结果。2.资料的统计描述和总体指标的估计 通过计算各种统计指标和统计图表来描述资料的集中趋势、离散趋势和分布
3、特征况(如正态分布或偏态分布);利用样本指标来估计总体指标的大小。,第1章绪论,第5页 共654页,3.假设检验 是通过统计检验方法(如t检验、u检验、F检验、卡方检验、秩和检验等)来推断两组或多组统计指标的差异是抽样误差造成的还是有本质的差别。4.相关与回归 医学中存在许多相互联系、相互制约的现象。如儿童的身高与体重、胸围与肺活量、血糖与尿糖等,都需要利用相关与回归来分析。,第1章绪论,第6页 共654页,5.多因素分析 如多元回归、判别分析、聚类分析、正交设计分析、主成分分析、因子分析、logistic回归、Cox比例风险回归等,都是分析医学中多因素有效的方法(本书不涉及,请参考有关统计书
4、籍)。这些方法计算复杂,大部分需借助计算机来完成。 6.健康统计 研究人群健康的指标与统计方法,除了用上述的某些方法外,他还有其特有的方法,如寿命表、生存分析、死因分析、人口预测等方法,第1章绪论,第7页 共654页,医学统计工作可分为四个步骤:统计设计、搜集资料、整理资料和分析资料。这四个步骤密切联系,缺一不可,任何一个步骤的缺陷和失误,都会影响统计结果的正确性。,第二节 统计工作的基本步骤,第1章绪论,第8页 共654页,设计(design)是统计工作的第一步,也是关键的一步,是对统计工作全过程的设想和计划安排。 统计设计就是根据研究目的确定试验因素、受试对象和观察指标,并在现有的客观条件
5、下决定用什么方式和方法来获取原始资料,并对原始资料如何进行整理,以及整理后的资料应该计算什么统计指标和统计分析的预期结果如何等。,一、统计设计,第1章绪论,第9页 共654页,搜集资料(collection of date) 是根据设计的要求,获取准确可靠的原始资料,是统计分析结果可靠的重要保证。医学统计资料的来源主要有以下三个方面:1.统计报表 统计报表是医疗卫生机构根据国家规定的报告制度,定期逐级上报的有关报表。如法定传染病报表、出生死亡报表、医院工作报表等,报表要完整、准确、及时。,二、搜集资料,第1章绪论,第10页 共654页,2.医疗卫生工作记录 如病历、医学检查记录、卫生监测记录等
6、。 3.专题调查或实验研究 它是根据研究目的选定的专题调查或实验研究,搜集资料有明确的目的与针对性。它是医学科研资料的主要来源。,第1章绪论,第11页 共654页,整理资料(sorting data)的目的就是将搜集到的原始资料进行反复核对和认真检查,纠正错误,分类汇总,使其系统化、条理化,便于进一步的计算和分析。整理资料的过程如下:1.审核:认真检查核对,保证资料的准确性和完整性。 2.分组:归纳分组,分组方法有两种: 质量分组,即将观察单位按其类别或属性分组,如按性别、职业、阳性和阴性等分组。数量分组,即将观察单位按其数值的大小分组,如按年龄的大小、药物剂量的大小等分组。,三、整理资料,第
7、1章绪论,第12页 共654页,3.汇总: 分组后的资料要按照设计的要求进行汇总,整理成统计表。原始资料较少时用手工汇总,当原始资料较多时,可使用计算机汇总。四、分析资料 分析资料(analysis of data) 是根据设计的要求,对整理后的数据进行统计学分析,结合专业知识,作出科学合理的解释。,第1章绪论,第13页 共654页,1.统计描述(descriptive statistics) 将计算出的统计指标与统计表、统计图相结合,全面描述资料的数量特征及分布规律。 2.统计推断(inferential statistics) 使用样本信息推断总体特征。通过样本统计量进行总体参数的估计和假
8、设检验,以达到了解总体的数量特征及其分布规律,才是最终的研究目的。,统计分析包括以下两大内容:,第1章绪论,第14页 共654页,医学统计资料按研究指标的性质一般分为定量资料、定性资料和等级资料三大类。一、定量资料定量资料(quantitative data) 亦称计量资料(measurement data),是用定量的方法测定观察单位(个体)某项指标数值的大小,所得的资料称定量资料。如身高()、体重()、脉搏(次/分)、血压(kPa)等为数值变量,其组成的资料为定量资料。,第三节 统计资料的类型,第1章绪论,第15页 共654页,定性资料(qualitative data) 亦称计数资料(e
9、numeration data)或分类资料(categorical data),是将观察单位按某种属性或类别分组,清点各组的观察单位数,所得的资料称定性资料。 定性资料的观察指标为分类变量(categorical variable)。如人的性别按男、女分组;化验结果按阳性、阴性分组;动物实验按生存、死亡分组;调查某人群的血型按A、B、O、AB分组等,观察单位出现的结果为分类变量,分类变量没有量的差别,只有质的不同,其组成的资料为定性资料。,二、定性资料,第1章绪论,第16页 共654页,三、等级资料,等级资料(ranked data)亦称有序分类资料(ordinal categorical d
10、ata),是将观察单位按属性的等级分组,清点各组的观察单位数,所得的资料为等级资料。如治疗结果分为治愈、显效、好转、无效四个等级。,第1章绪论,第17页 共654页,根据需要,各类变量可以互相转化。若按贫血的诊断标准将血红蛋白分为四个等级:重度贫血、中度贫血、轻度贫血、正常,可按等级资料处理。有时亦可将定性资料或等级资料数量化,如将等级资料的治疗结果赋以分值,分别用0、1、2等表示,则可按定量资料处理。 如调查某人群的尿糖的情况,以人为观察单位,结果可分、五个等级。,第1章绪论,第18页 共654页,同质(homogeneity) 是指观察单位或研究个体间被研究指标的主要影响因素相同或基本相同
11、。如研究儿童的生长发育,同性别、同年龄、同地区、同民族、健康的儿童即为同质儿童。变异(variation) 由于生物个体的各种指标所受影响因素极为复杂,同质的个体间各种指标存在差异,这种差异称为变异。如同质的儿童身高、体重、血压、脉搏等指标会有一定的差别。,第四节 统计学中的几个基本概念一、同质与变异,第1章绪论,第19页 共654页,二、总体与样本,样本(sample):是从总体中随机抽取的部分观察单位变量值的集合。样本的例数称为样本含量(sample size)。注意:1。总体是相对的,总体的大小是根据研究目的而确定的。2。样本应有代表性,即应该随机抽样并有足够的样本含量。,第1章绪论,第
12、20页 共654页,图示:总体与样本,population,sample2,sample1,sample3,sample4,sample5,第1章绪论,第21页 共654页,三、参数与统计量,参数(parameter):由总体计算或得到的统计指标称为参数。总体参数具有很重要的参考价值。如总体均数,总体标准差等。统计量(statistic):由样本计算的指标称为统计量。如样本均数,样本标准差s等。注意:一般不容易得到参数,而容易获得样本统计量。,第1章绪论,第22页 共654页,四、抽样误差,抽样误差(sample error): 由于随机抽样所引起的样本统计量与总体参数之间的差异以及样本统计量
13、之间的差别称为抽样误差。如样本均数与总体均数之间的差别,样本率与总体率的差别等。注意:抽样误差是不可避免的。无论抽样抽得多么好,也会存在抽样误差。,第1章绪论,第23页 共654页,五、概率,概率(probability):是描述随机事件发生可能性大小的量值。用英文大写字母P来表示。概率的取值范围在01之间。当P0时,称为不可能事件;当P1时,称为必然事件。小概率事件:统计学上一般把P0.05或P0.01的事件称为小概率事件。小概率原理:小概率事件在一次试验中几乎不可能发生。利用该原理可对科研资料进行假设检验。,第1章绪论,第24页 共654页,第五节 学习医学统计学应注意的问题,1.重点掌握
14、医学统计学的基本知识、基本技能、基本概念和基本方法,掌握使用范围和注意事项。2.要培养科学的统计思维方法,提高分析问题、解决问题的能力。 3.掌握调查设计和实验设计的原则,培养搜集、整理、分析统计资料的系统工作能力。,第1章绪论,第25页 共654页,课后作业,列举出计量资料、分类资料、等级资料各10个实例。 列举出可能事件、必然事件、不可能事件及小概率事件各10个。 认真复习本章已学过的基本概念23遍。,第1章绪论,第26页 共654页,Best Wishes to All of You! Thank You for Listening!,THE END,第1章绪论,第27页 共654页,医
15、学本科生用,主讲 王守英,新乡医学院公共卫生学系综合实验室,医学统计学,第2章定量资料统计描述,第28页,第2章定量资料的统计描述 目录,第二节 集中趋势的描述,第三节 离散趋势的描述,第四节 正态分布,第一节 频数分布表,第2章定量资料统计描述,第29页,统计描述:是用统计图表、统计指标来描述资料的分布规律及其数量特征。频数分布表(frequency distribution table):主要由组段和频数两部分组成表格。,第一节 频数分布表,第二章 定量资料的统计描述,第2章定量资料统计描述,第30页,二、频数分布表的编制,编制步骤 :1. 计算全距 (range): 一组变量值最大值和最
16、小值之差称为全距(range),亦称极差,常用R表示。 2. 确定组距(class interval): 组距用i表示; 3. 划分组段: 每个组段的起点称组下限,终点称组上限。一般分为815组。 ;4. 统计频数: 将所有变量值通过划记逐个归入相应组段 ;5.频率与累计频率: 将各组的频数除以n所得的比值被称为频率。累计频率等于累计频数除以总例数。,第2章定量资料统计描述,第31页,表2-2 某年某市120名12岁健康男孩身高(cm)的频数分布,第2章定量资料统计描述,第32页,第2章定量资料统计描述,第33页,二、频数分布表的用途,1.揭示资料的分布类型 2.观察资料的集中趋势和离散趋势
17、3.便于发现某些特大或特小的可疑值 4.便于进一步计算统计指标和作统计处理,第2章定量资料统计描述,第34页,第2章定量资料统计描述,第35页,第二节 集中趋势的描述,集中趋势 :代表一组同质变量值的集中趋势 或平均水平。 常用的平均数有算术均数、几何均数和中位数。另外不常用的有:众数,调和平均数和调整均数等。,第2章定量资料统计描述,第36页,一、算术均数,算术均数 (arithmetic mean): 简称均数。适用条件:对称分布或近似对称分布的资料。 习惯上以希腊字母表示总体均数(population mean),以英文字母表示样本均数(sample mean),第2章定量资料统计描述,
18、第37页,1. 直接法:用于观察值个数不多时,计算方法,第2章定量资料统计描述,第38页,2.加权法(weighting method):用于变量值个数 较多时。,注意:权数即频数f,为权重权衡之意。,第2章定量资料统计描述,第39页,表2-4 120名12岁健康男孩身高(cm)均数和标准差加权法计算表,第2章定量资料统计描述,第40页,第2章定量资料统计描述,第41页,120名12岁健康男孩身高均数为143.07cm。,计算结果,第2章定量资料统计描述,第42页,几何均数(geometric mean,简记为):表示其平均水平。 适用条件:对于变量值呈倍数关系或呈对数正态分布(正偏态分布),
19、如抗体效价及抗体滴度,某些传染病的潜伏期,细菌计数等。计算公式:有直接法和加权法。,二、几何均数,第2章定量资料统计描述,第43页,1.直接法: 用于变量值的个数n较少时,第2章定量资料统计描述,第44页,直接法计算实例,第2章定量资料统计描述,第45页,2.加权法 : 用于资料中相同变量值的个数f(即频数)较多时。,第2章定量资料统计描述,第46页,表2-5 50名儿童麻疹疫苗接种后血凝抑制抗体滴度几何均数计算表,第2章定量资料统计描述,第47页,第2章定量资料统计描述,第48页,50名儿童麻疹疫苗接种后平均血凝抑制抗体滴度为1:60.55。,计算结果:将有关已知数据代入公式有,第2章定量资
20、料统计描述,第49页,变量值中不能有0;不能同时有正值和负值;若全是负值,计算时可先把负号去掉,得出结果后再加上负号。,计算几何均数注意事项:,第2章定量资料统计描述,第50页,中位数 定义:将一组变量值从小到大按顺序排列,位次居中的变量值称为中位数(median,简记为M)。适用条件:变量值中出现个别特小或特大的数值;资料的分布呈明显偏态,即大部分的变量值偏向一侧;变量值分布一端或两端无确定数值,只有小于或大于某个数值;资料的分布不清。,三、中位数及百分位数,第2章定量资料统计描述,第51页,定义:百分位数(percentile)是一种位置指标,以Px表示。百分位数是将频数等分为一百的分位数
21、。一组观察值从小到大按顺序排列,理论上有x%的变量值比Px小,有(100-x)%的变量值比Px大。故P50分位数也就是中位数,即P50=M 。, 百分位数,第2章定量资料统计描述,第52页,描述一组资料在某百分位置上的水平;用于确定正常值范围;计算四分位数间距。,百分位数的应用条件:,第2章定量资料统计描述,第53页,计算方法:有直接法和加权法,1.直接法:用于例数较少时,n为奇数时,n为偶数时,第2章定量资料统计描述,第54页,2.频数表法: 用于例数较多时,中位数,百分位数,第2章定量资料统计描述,第55页,表2-6 145例食物中毒病人潜伏期分布表,第2章定量资料统计描述,第56页,第2
22、章定量资料统计描述,第57页,先找到包含Px的最小累计频率;该累计频率同行左边的组段值为L;L同行右边的频数为fx(或fm);L前一行的累计频数为fL;将上述已知条件代入公式计算Px或P50 。,计算中位数及百分位数的步骤:,第2章定量资料统计描述,第58页,计算结果:,第2章定量资料统计描述,第59页,定义:用来说明变量值的离散程度或变异程度。注意:仅用集中趋势尚不能完全反映一组数据的特征。故应将集中趋势和离散趋势结合起来才能更好地反映一组数据的特征。常用离散指标有:极差、四分位数间距、标准差、方差、变异系数。,第三节 离散趋势的描述,第2章定量资料统计描述,第60页,甲组: 184 186
23、 188 190 192乙组: 180 184 188 192 196两组球员的平均身高都是188cm,但甲组球员身高比较集中,乙组球员身高比较分散。为了说明离散趋势,就要用离散指标。,实例分析,第2章定量资料统计描述,第61页,极差 极差(range,简记为R)亦称全距,即一组变量值中最大值与最小值之差 。特点:计算简单,不稳定,不全面,易变化;可用于各种分布的资料。,一、极差和四分位数间距,第2章定量资料统计描述,第62页,四分位数间距,公式: Q= P75P25 特点:比极差稳定,只反映中间两端值的差异。 计算不太方便。可用于各种分布的资料。,第2章定量资料统计描述,第63页,二、方差和
24、标准差,方差(variance),总体方差,样本方差,第2章定量资料统计描述,第64页,自由度(degree of freedom)的概念,n-1是自由度,用希腊小写字母表示,读作nju:。定义:在N维或N度空间中能够自由选择的维数或度数。例:ABC,共有n=3个元素,其中只能任选2个元素的值,故自由度n-1=3-1=2。,第2章定量资料统计描述,第65页,方差的特点,充分反映每个数据间的离散状况,意义深刻;指标稳定,应用广泛,但计算较为复杂,不易理解;方差的单位与原数据不同,有时使用时不太方便;在方差分析中应用甚广而极为重要。,第2章定量资料统计描述,第66页,(二)标准差(standard
25、 deviation),总体标准差,样本标准差,第2章定量资料统计描述,第67页,牢记:离均差平方和展开式:,第2章定量资料统计描述,第68页,标准差的特点:,意义同方差,是方差的开平方;标准差的单位与原数据相同,使用方便,意义深刻,应用广泛;故一般已作为医学生物学领域中反映变异的标准,故称标准差。,第2章定量资料统计描述,第69页,标准差的计算方法:可分为直接法和加权法。,1.直接法,2.加权法,第2章定量资料统计描述,第70页,直接法:标准差计算实例:,例2.12 例2.2中7名正常男子红细胞数(1012/L)如下:4.67, 4.74, 4.77, 4.88,4.76, 4.72, 4.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医学统计学 医学 统计学 完全 ppt 课件
链接地址:https://www.31ppt.com/p-1419431.html