《人群健康研究》PPT课件.ppt
《《人群健康研究》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《人群健康研究》PPT课件.ppt(99页珍藏版)》请在三一办公上搜索。
1、预防医学基础课件(第二版),制作:太原市卫生学校 石海兰,学习目标1说出统计中几个基本概念和统计工作的基本步骤2学会根据不同的资料选择适宜的集中趋势和离散趋势指标,并会进行计算。3写出假设检验的基本步骤,会作常用的t检验4简述常用相对数的种类及应用时的注意事项5能够根据资料的性质正确选择检验方法,会作常用的检验6统计表和统计图的意义和制作方法,会根据不同资料选择合适的统计图,第4章人群健康研究的统计方法,一、统计中的基本概念(一)同质和变异 同质(homogeneity)是指事物的性质、影响条件或背景相同或相近。例如,研究儿童生长发育情况,应选取同性别、同年龄儿童进行观察。同质个体间的差异,称
2、为变异(variation)。如研究儿童的身体发育,即使同质(同性别、同年龄)儿童的身高,也有高有低,各不相同,称为身高的变异。同一种药物,同样的剂量治疗同样病种的病人,其疗效亦不一样。同质观察单位之间的个体变异,是生物的重要特征。统计的任务就是在同质分组的基础上,通过对个体变异的研究,透过偶然现象,反映同质事物的本质特征和规律。,第1节卫生统计的基本概念和步骤,总体(population)是根据研究目的所确定的同质的观察单位的全体。样本(sample)是从总体中随机抽出的部分有代表性的个体。所谓随机,即总体中的每一个个体均有同等的机会被抽取。这种从总体中抽取部分个体的过程称为抽样(sampl
3、ing)。样本所包含的个体数目,称为样本含量或样本大小,用n表示。,(二)总体和样本,(三)抽样误差,由于总体中各观察单位间存在个体差异,抽样研究中抽取的样本,只包含总体的一部分观察单位,因而,样本指标不可能恰好等于相应的总体指标。这种由于抽样而引起的样本指标与总体指标、样本指标与样本指标之间的差异,统计学上称为抽样误差(samplingerror)。一般说来,样本越大,则抽样误差越小,越和总体的情况相接近,用样本推断总体的精确度越高,反之亦然。由于个体变异是客观存在的,因而抽样误差是不可避免的,但可以通过增加样本含量来减小抽样误差。,(四)资料的类型,1数值变量资料 对每个观察单位用定量方法
4、测定某项指标的数值大小,所得的资料称为数值变量资料,亦称为计量资料(measurementdata)。2分类变量资料 将观察单位按某种属性或类别不同进行分类计数所得的资料,称为分类变量资料。分类变量资料分为无序分类变量即计数资料(enumerationdata)和有序分类变量即等级资料(rankeddata)。,实际上,资料的类型可以根据研究分析的需要进行相互转化。例如,观察每个人的血红蛋白含量(g/L),属计量资料;若按血红蛋白正常与异常分为两组,清点各组人数,则为计数资料;若将血红蛋白含量(gL)的多少分为五个等级:重度贫血、中度贫血、较度贫血、正常、血红蛋白增高,清点各等级人数,则成为等
5、级资料。,3资料的转化,概率(probability)是描述某事件或某现象发生的可能性大小的一个度量,用符号P来表示。根据事件发生可能性的大小,将所有事件分为三类:在一定条件下,肯定发生的事件称为必然事件,肯定不发生的事件称为不可能事件,可能发生也可能不发生的事件,称为随机事件或偶然事件。必然事件的概率等于1,不可能事件的概率等于0,随机事件的概率介于0与1之间。,(五)概 率,二、统计工作的基本步骤,统计工作一般分四个步骤,即先有一个周密的设计、然后根据设计的要求搜集资料、整理资料和分析资料。这四个步骤是相互联系、前后呼应、不可分割的整体。(一)统计设计设计是统计工作的第一步,也是最关键的一
6、步,是对统计工作全过程的设想和计划,是今后研究工作应遵循的依据。,(二)搜集资料,搜集资料(collectionofdata)是根据统计设计的要求,及时取得完整、准确的原始数据的过程。1医学研究资料的来源(1)日常医疗卫生工作记录(2)统计报表与报告卡(3)专题调查和实(试)验资料 2搜集资料的注意事项 搜集资料时应注意资料的完整、准确、及时。,(三)整理资料,整理资料(sortingdata)是根据设计的要求,对原始资料进行科学的加工、整理,使其条理化、系统化,以便进一步进行统计分析的过程。一般来说,整理资料首先应检查核对资料,检查核对资料要注意以下几点:1资料的逻辑检查2从专业角度对资料的
7、合理性进行检查3从专业角度对资料的一致性进行检查,(四)分析资料,分析资料(analysisofdata),就是将整理好的资料,按照设计的要求,进行统计描述和统计推断,阐明事物的内在规律。统计描述(descriptivestatistics)是将计算得到的统计指标与统计图表结合,来描述数据的分布特征、变化趋势等,为进一步进行统计推断奠定基础。统计推断(inferentialstatistics)是根据研究目的和资料性质,利用样本信息对总体特征进行估计和推断的统计方法,包括参数估计和假设检验。分析资料时应注意,不同资料类型,不同分析目的,使用的统计分析方法不同,本章后几节将作详细介绍。,第2节
8、数值变量资料的统计,计量资料经过整理后,可以计算一系列统计指标,以说明资料的特征,便于对资料作进一步的统计分析。平均数描述其集中趋势或平均水平,标准差描述其离散程度或变异程度。当例数较多时,可先编制成频数表,了解变量值的分布情况,然后再计算其统计指标。,一、数值变量资料的频数分布,所谓频数就是观察值的个数。频数表(frequencytable),即同时列出观察值在其取值范围内,于各组段中频数分布情况的表格。1频数表的编制现举例说明数值变量资料的频数表编制方法。例4-1某年某市100名成年男子血清总胆固醇测定结果如表4-1,试编制频数表。,表4-1某年某市100名成年男子血清总胆固醇(mmol/
9、L)测定结果,(1)求全距:全距(range)又称极差,是观察值中最大值与最小值之差,用R表示。即:R=Xmax-Xmin(公式4-1)式中:R全距Xmax最大值Xmin最小值 本例最大值Xmax=7.22mmol/L,最小值Xmin=2.70mmol/L,R=7.22-2.70=4.52(mmol/L)。(2)定组段数、组距:组段数一般分815个组为宜,根据全距和组段数确定组距(i)。组距可用公式4-2进行估算。i=R/k(公式4-2)本例i=4.52/10=0.452(mmol/L),为方便计算,取0.5mmol/L作为组距。,(3)划分组段:各组段的界限应清晰分明,第一组段应包括最小值,
10、最后一组段应包括最大值。每一组段的起始值称下限,终止值称上限。为了避免交叉,各组段从下限开始(不包括下限),到本组段上限为止(包括上限),各组段上限、下限之间用“”连接。注意:最后一组段应同时写出上下限。本例第一组段可为2.50开始,包括最小值,第二组段3.00,第三组段3.50,第十组段7.007.50,(4)归组汇总:将原始数据进行归纳计数,可用划“正”字的方式(见表4-2第2列),并给出各组段的频数f(见表4-2第3列),频数表的编制即完成。,表4-2 某年某地100名成年男子血清总胆固醇(mmol/L)频数表,频数表的用途,1.揭示变量值的频数分布类型 2.确定变量值的两个重要特征 3
11、.便于发现某些特大和特小的可疑值 4.便于进一步进行统计分析和处理,二、集中趋势指标,集中趋势指标又称平均数(average),它反映一组观察值的集中位置和平均水平,常作为一组资料平均水平的代表值,可用于不同组间的分析比较。常用的平均数有算术均数、几何均数和中位数。应用中要根据不同的资料分布类型选择合适的平均数指标。,(一)算术均数,1.适用条件:适用于频数分布呈对称分布资料,特别正态分布资料。2.计算方法 直接法 加权法,直 接 法,加 权 法,(二)几何均数,1.适用条件:适用于等比数列资料、对数正态分布资料(即原始数据呈偏态分布,但经对数转换后呈正态分布的资料)及近似对数正态分布资料。2
12、.计算方法 直接法 加权法,直 接 法,加 权 法,(三)中位数,1.适用条件 中位数表示平均水平,不受资料分布类型的影响,因此应用范围较广。常用于:(1)偏态分布资料;(2)数据的一端或两端无明确界值的资料,即开口资料;(3)分布类型不清楚的资料。2.计算方法 直接法 频数表法,直 接 法,将观察值按大小排序,当观察值例数为奇数时,中位数就是位次居中的那个数,即位次为(n+1)/2的那个数;当观察值例数为偶数时,中位数就是中间两个数相加再除以2,即位次为n/2和(n/2+1)的两个数的均数。,频数表法,当为频数表资料时,可先分别计算累计频数和累计频率(表4-4第3列、第4列),然后按公式4-
13、8计算中位数。,三、离散趋势指标,集中趋势是数值变量资料的一个重要特征,但仅有集中趋势指标还不能很好地描述数值变量资料的分布规律,还要有离散趋势指标。为了比较全面地描述数值变量资料的分布规律,除了需要有描述集中趋势的指标外,还需要有描述离散趋势的指标。离散趋势又称离散程度、变异程度。常用的离散趋势指标有全距、方差、标准差、变异系数等。,(一)全距,全距又称极差,用符号R表示,是观察值中最大值与最小值的差值。如例4-9中,R甲=4,R乙和R丙均=8,甲组的全距小,乙、丙两组的全距大,说明甲组的离散程度小,乙、丙两组的离散程度大。全距的优点是计算方便,容易理解;缺点是其大小仅与最大值、最小值有关,
14、不能客观地反映其它观察值的变异情况。如本例,乙、丙两组资料的离散程度何者更大,全距无法反映。,(二)方差,为了克服全距的缺陷,必须考虑每一个观察值对离散程度的影响。方差(variance)是常用的离散趋势指标,用2表示,计算公式为:,由于医学研究中常用抽样研究,总体方差往往是未知的,常用样本方差来估计,样本方差用s2表示。统计研究发现,用样本资料计算出的样本方差往往比总体方差偏小,为了得到较为准确的结果,将样本方差分母中n减去1,则计算公式为:,(三)标准差,方差因计算方便的原因,原有的计量单位被平方,这不利于进一步统计处理,因此人们常用方差的平方根标准差(standard deviation
15、)替代方差描述资料的离散程度。总体标准差(用表示)、样本标准差(用s表示)计算公式分别为:,1标准差的计算,直接法 未分组的资料,可用公式4-12直接计算。但此公式计算先得求出均数,在实际工作中这样运算很不方便,经数学推导,公式4-12可转变为:,加权法 与加权法计算均数一样,当相同观察值较多或频数表资料时,可按公式4-14计算:,2标准差的应用,表示变量值的离散程度 标准差表示变量值的变异程度时,要求单位相同,均数相近。标准越大,表示变量值的变异程度越大;反之标准差越小,表示变量值的变异程度越小。根据正态分布原理,应用于概括估计观察值的频数分布和医学参考值范围。可以计算变异系数和标准误。,(
16、四)变异系数,当所比较的两组或多组资料的单位不同或均数相差悬殊时,不能用标准差直接比较其离散程度,而应用变异系数(coefficient of variation,用CV表示)。变异系数又称离散系数,是标准差与均数的比值,常用百分数表示,计算公式为:,变异系数没有单位,常用于:,计量单位不同的资料间的比较 均数相差悬殊资料间的比较,四、假设检验t检验,(一)假设检验的概念假设检验(hypothesis test)是统计推断的另一重要内容,亦称显著性检验(significant test)。假设检验是对所检验的总体先提出一个假设,然后通过统计分析去推断是否拒绝这一假设。如两组1岁婴儿的头围均数,
17、甲组为45cm,乙组为42 cm,这两组均数不同可能是抽样误差引起,也可能是本质不同。在下结论前首先要区别两组均数间差异的性质和来源。若是由于抽样误差引起的差异,统计上认为无显著意义,如果这种差异超出了抽样误差的范围,那么很可能是本质原因引起的差异,统计上称这种差异有显著意义。判断两个均数之差有无显著意义的假设检验,常用t检验。,(二)假设检验的基本步聚,1.建立假设和确定检验水准 2.选定检验方法并计算统计量 3.确定P值 4.判断结果,(三)常用的t检验,假设检验的具体方法,通常用检验统计量来命名。如检验统计量为t则称t检验,检验统计量为u则称u检验。实际应用时应注意各种检验方法的用途、适
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 人群健康研究 人群 健康 研究 PPT 课件

链接地址:https://www.31ppt.com/p-5459684.html