《人群健康研究》PPT课件.ppt

上传人：小飞机

文档编号：5459684

上传时间：2023-07-09

格式：PPT

页数：99

大小：3.53MB

《《人群健康研究》PPT课件.ppt》由会员分享，可在线阅读，更多相关《《人群健康研究》PPT课件.ppt（99页珍藏版）》请在三一办公上搜索。

1、预防医学基础课件（第二版）,制作：太原市卫生学校石海兰,学习目标1说出统计中几个基本概念和统计工作的基本步骤2学会根据不同的资料选择适宜的集中趋势和离散趋势指标，并会进行计算。3写出假设检验的基本步骤，会作常用的t检验4简述常用相对数的种类及应用时的注意事项5能够根据资料的性质正确选择检验方法，会作常用的检验6统计表和统计图的意义和制作方法，会根据不同资料选择合适的统计图,第4章人群健康研究的统计方法,一、统计中的基本概念（一）同质和变异同质(homogeneity)是指事物的性质、影响条件或背景相同或相近。例如，研究儿童生长发育情况，应选取同性别、同年龄儿童进行观察。同质个体间的差异，称

2、为变异(variation)。如研究儿童的身体发育，即使同质(同性别、同年龄)儿童的身高，也有高有低，各不相同，称为身高的变异。同一种药物，同样的剂量治疗同样病种的病人，其疗效亦不一样。同质观察单位之间的个体变异，是生物的重要特征。统计的任务就是在同质分组的基础上，通过对个体变异的研究，透过偶然现象，反映同质事物的本质特征和规律。,第1节卫生统计的基本概念和步骤,总体(population)是根据研究目的所确定的同质的观察单位的全体。样本(sample)是从总体中随机抽出的部分有代表性的个体。所谓随机，即总体中的每一个个体均有同等的机会被抽取。这种从总体中抽取部分个体的过程称为抽样(sampl

3、ing)。样本所包含的个体数目，称为样本含量或样本大小，用n表示。,（二）总体和样本,（三）抽样误差,由于总体中各观察单位间存在个体差异，抽样研究中抽取的样本，只包含总体的一部分观察单位，因而，样本指标不可能恰好等于相应的总体指标。这种由于抽样而引起的样本指标与总体指标、样本指标与样本指标之间的差异，统计学上称为抽样误差(samplingerror)。一般说来，样本越大，则抽样误差越小，越和总体的情况相接近，用样本推断总体的精确度越高，反之亦然。由于个体变异是客观存在的，因而抽样误差是不可避免的，但可以通过增加样本含量来减小抽样误差。,（四）资料的类型,1数值变量资料对每个观察单位用定量方法

4、测定某项指标的数值大小，所得的资料称为数值变量资料，亦称为计量资料（measurementdata）。2分类变量资料将观察单位按某种属性或类别不同进行分类计数所得的资料，称为分类变量资料。分类变量资料分为无序分类变量即计数资料(enumerationdata)和有序分类变量即等级资料（rankeddata）。,实际上，资料的类型可以根据研究分析的需要进行相互转化。例如，观察每个人的血红蛋白含量（g/L），属计量资料；若按血红蛋白正常与异常分为两组，清点各组人数，则为计数资料；若将血红蛋白含量(gL)的多少分为五个等级：重度贫血、中度贫血、较度贫血、正常、血红蛋白增高，清点各等级人数，则成为等

5、级资料。,3资料的转化,概率(probability)是描述某事件或某现象发生的可能性大小的一个度量，用符号P来表示。根据事件发生可能性的大小，将所有事件分为三类：在一定条件下，肯定发生的事件称为必然事件，肯定不发生的事件称为不可能事件,可能发生也可能不发生的事件，称为随机事件或偶然事件。必然事件的概率等于1,不可能事件的概率等于0,随机事件的概率介于0与1之间。,（五）概率,二、统计工作的基本步骤,统计工作一般分四个步骤，即先有一个周密的设计、然后根据设计的要求搜集资料、整理资料和分析资料。这四个步骤是相互联系、前后呼应、不可分割的整体。（一）统计设计设计是统计工作的第一步，也是最关键的一

6、步，是对统计工作全过程的设想和计划，是今后研究工作应遵循的依据。,（二）搜集资料,搜集资料（collectionofdata）是根据统计设计的要求，及时取得完整、准确的原始数据的过程。1医学研究资料的来源（1）日常医疗卫生工作记录（2）统计报表与报告卡（3）专题调查和实（试）验资料 2搜集资料的注意事项搜集资料时应注意资料的完整、准确、及时。,（三）整理资料,整理资料（sortingdata）是根据设计的要求，对原始资料进行科学的加工、整理，使其条理化、系统化，以便进一步进行统计分析的过程。一般来说，整理资料首先应检查核对资料，检查核对资料要注意以下几点：1资料的逻辑检查2从专业角度对资料的

7、合理性进行检查3从专业角度对资料的一致性进行检查,（四）分析资料,分析资料（analysisofdata），就是将整理好的资料，按照设计的要求，进行统计描述和统计推断，阐明事物的内在规律。统计描述（descriptivestatistics）是将计算得到的统计指标与统计图表结合，来描述数据的分布特征、变化趋势等，为进一步进行统计推断奠定基础。统计推断（inferentialstatistics）是根据研究目的和资料性质，利用样本信息对总体特征进行估计和推断的统计方法，包括参数估计和假设检验。分析资料时应注意，不同资料类型，不同分析目的，使用的统计分析方法不同，本章后几节将作详细介绍。,第2节

8、数值变量资料的统计,计量资料经过整理后，可以计算一系列统计指标，以说明资料的特征，便于对资料作进一步的统计分析。平均数描述其集中趋势或平均水平，标准差描述其离散程度或变异程度。当例数较多时，可先编制成频数表，了解变量值的分布情况，然后再计算其统计指标。,一、数值变量资料的频数分布,所谓频数就是观察值的个数。频数表(frequencytable)，即同时列出观察值在其取值范围内，于各组段中频数分布情况的表格。1频数表的编制现举例说明数值变量资料的频数表编制方法。例4-1某年某市100名成年男子血清总胆固醇测定结果如表4-1，试编制频数表。,表4-1某年某市100名成年男子血清总胆固醇(mmol/

9、L)测定结果,（1）求全距：全距(range)又称极差，是观察值中最大值与最小值之差，用R表示。即：R=Xmax-Xmin（公式4-1）式中：R全距Xmax最大值Xmin最小值本例最大值Xmax=7.22mmol/L，最小值Xmin=2.70mmol/L，R=7.22-2.70=4.52(mmol/L)。（2）定组段数、组距：组段数一般分815个组为宜，根据全距和组段数确定组距(i)。组距可用公式4-2进行估算。i=R/k（公式4-2）本例i=4.52/10=0.452(mmol/L)，为方便计算，取0.5mmol/L作为组距。,（3）划分组段：各组段的界限应清晰分明，第一组段应包括最小值，

10、最后一组段应包括最大值。每一组段的起始值称下限，终止值称上限。为了避免交叉，各组段从下限开始（不包括下限），到本组段上限为止（包括上限），各组段上限、下限之间用“”连接。注意：最后一组段应同时写出上下限。本例第一组段可为2.50开始，包括最小值，第二组段3.00，第三组段3.50，第十组段7.007.50,（4）归组汇总：将原始数据进行归纳计数，可用划“正”字的方式（见表4-2第2列），并给出各组段的频数f（见表4-2第3列），频数表的编制即完成。,表4-2 某年某地100名成年男子血清总胆固醇（mmol/L）频数表,频数表的用途,1.揭示变量值的频数分布类型 2.确定变量值的两个重要特征 3

11、.便于发现某些特大和特小的可疑值 4.便于进一步进行统计分析和处理,二、集中趋势指标,集中趋势指标又称平均数(average)，它反映一组观察值的集中位置和平均水平，常作为一组资料平均水平的代表值，可用于不同组间的分析比较。常用的平均数有算术均数、几何均数和中位数。应用中要根据不同的资料分布类型选择合适的平均数指标。,（一）算术均数,1.适用条件：适用于频数分布呈对称分布资料，特别正态分布资料。2.计算方法直接法加权法,直接法,加权法,（二）几何均数,1.适用条件：适用于等比数列资料、对数正态分布资料（即原始数据呈偏态分布，但经对数转换后呈正态分布的资料）及近似对数正态分布资料。2

12、.计算方法直接法加权法,直接法,加权法,（三）中位数,1.适用条件中位数表示平均水平，不受资料分布类型的影响，因此应用范围较广。常用于：（1）偏态分布资料；（2）数据的一端或两端无明确界值的资料，即开口资料；（3）分布类型不清楚的资料。2.计算方法直接法频数表法,直接法,将观察值按大小排序，当观察值例数为奇数时，中位数就是位次居中的那个数，即位次为(n+1)/2的那个数；当观察值例数为偶数时，中位数就是中间两个数相加再除以2，即位次为n/2和(n/2+1)的两个数的均数。,频数表法,当为频数表资料时，可先分别计算累计频数和累计频率（表4-4第3列、第4列），然后按公式4-

13、8计算中位数。,三、离散趋势指标,集中趋势是数值变量资料的一个重要特征，但仅有集中趋势指标还不能很好地描述数值变量资料的分布规律，还要有离散趋势指标。为了比较全面地描述数值变量资料的分布规律，除了需要有描述集中趋势的指标外，还需要有描述离散趋势的指标。离散趋势又称离散程度、变异程度。常用的离散趋势指标有全距、方差、标准差、变异系数等。,（一）全距,全距又称极差，用符号R表示，是观察值中最大值与最小值的差值。如例4-9中，R甲=4，R乙和R丙均=8，甲组的全距小，乙、丙两组的全距大，说明甲组的离散程度小，乙、丙两组的离散程度大。全距的优点是计算方便，容易理解；缺点是其大小仅与最大值、最小值有关，

14、不能客观地反映其它观察值的变异情况。如本例，乙、丙两组资料的离散程度何者更大，全距无法反映。,（二）方差,为了克服全距的缺陷，必须考虑每一个观察值对离散程度的影响。方差(variance)是常用的离散趋势指标，用2表示，计算公式为：,由于医学研究中常用抽样研究，总体方差往往是未知的，常用样本方差来估计，样本方差用s2表示。统计研究发现，用样本资料计算出的样本方差往往比总体方差偏小，为了得到较为准确的结果，将样本方差分母中n减去1，则计算公式为：,（三）标准差,方差因计算方便的原因,原有的计量单位被平方，这不利于进一步统计处理，因此人们常用方差的平方根标准差（standard deviation

15、）替代方差描述资料的离散程度。总体标准差（用表示）、样本标准差（用s表示）计算公式分别为：,1标准差的计算,直接法未分组的资料，可用公式4-12直接计算。但此公式计算先得求出均数，在实际工作中这样运算很不方便，经数学推导，公式4-12可转变为：,加权法与加权法计算均数一样，当相同观察值较多或频数表资料时，可按公式4-14计算：,2标准差的应用,表示变量值的离散程度标准差表示变量值的变异程度时，要求单位相同，均数相近。标准越大，表示变量值的变异程度越大；反之标准差越小，表示变量值的变异程度越小。根据正态分布原理，应用于概括估计观察值的频数分布和医学参考值范围。可以计算变异系数和标准误。,（

16、四）变异系数,当所比较的两组或多组资料的单位不同或均数相差悬殊时,不能用标准差直接比较其离散程度，而应用变异系数(coefficient of variation，用CV表示)。变异系数又称离散系数，是标准差与均数的比值,常用百分数表示，计算公式为：,变异系数没有单位，常用于：,计量单位不同的资料间的比较均数相差悬殊资料间的比较,四、假设检验t检验,(一)假设检验的概念假设检验（hypothesis test）是统计推断的另一重要内容，亦称显著性检验（significant test）。假设检验是对所检验的总体先提出一个假设，然后通过统计分析去推断是否拒绝这一假设。如两组1岁婴儿的头围均数，

17、甲组为45cm，乙组为42 cm，这两组均数不同可能是抽样误差引起，也可能是本质不同。在下结论前首先要区别两组均数间差异的性质和来源。若是由于抽样误差引起的差异，统计上认为无显著意义，如果这种差异超出了抽样误差的范围，那么很可能是本质原因引起的差异，统计上称这种差异有显著意义。判断两个均数之差有无显著意义的假设检验，常用t检验。,（二）假设检验的基本步聚,1.建立假设和确定检验水准 2.选定检验方法并计算统计量 3.确定P值 4.判断结果,（三）常用的t检验,假设检验的具体方法，通常用检验统计量来命名。如检验统计量为t则称t检验，检验统计量为u则称u检验。实际应用时应注意各种检验方法的用途、适

18、用条件和注意事项。常用的两均数假设检验的方法有：,1样本均数与总体均数比较的t检验,一般把标准值、理论值或经大量调查所得的稳定值作为已知的总体均数0。样本均数与总体均数比较的目的是推断样本所代表的总体均数（未知的）与已知总体均数0有无差别。t值计算公式如下：,2配对计量资料比较的t检验,在医学研究中，为了减少误差，提高检验效率，常采用配对设计(paired design)。配对设计主要有：将试验对象按照一定的条件配成若干对，然后随机将每对中的两个观察单位分配到实验组和对照组中去，给以不同的处理，观察某种指标的变化；同一组试验对象在处理前后观察某种指标的变化；对同一样品用两种方法检测结果的比较等

19、。其假设检验的目的是推断两种处理或处理前后的结果有无差别。计算公式如下：,3两个小样本均数比较的t检验,在医学研究中，能够进行配对比较的资料较少，更多的是两组资料的比较。目的是推断两样本各自代表的总体均数1 与2 是否相等。当两个样本含量较小时，n1+n2100，用t检验，t值的计算公式如下：,4假设检验的注意事项,要注意用单侧还是双侧检验要注意每种方法的应用条件要注意资料的可比性要注意判断结果不能绝对化要注意实际差别大小与统计意义的区别,第3节分类变量资料的统计,在医疗卫生工作中，通过日常医疗卫生工作记录、统计报表、现场调查、实验研究所搜集来的一些数据，如人口数、出生数、治愈数、阳

20、性数、阴性数等都是绝对数。绝对数可以反映事物在某时某地出现的实际情况，是统计分析和制订计划的基础。但绝对数的大小，常受基数多少的影响，不便于进行深入的分析比较。要比较资料的情况，必须计算相对数，再进行比较，才能得出正确的结论。,一、相对数常用指标,1相对数的概念,相对数（relative number）是两个有联系指标的比值，常用于分类变量即计数资料的统计分析。,2相对数的种类及计算方法,（1）率（rate）：又称频率指标，说明某现象发生的频率或强度。常以百分率（%）、千分率（）、万分率（1/万）、10万分率（1/10万）等表示。计算公式为：,计算时比例基数的选择，主要依据习惯用法或使算得的率

21、至少保留一位整数，以便于阅读、比较。如有效率、治愈率，习惯上用百分率；出生率、死亡率、人口自然增长率，习惯上用千分率；某病死亡专率、恶性肿瘤发病率，习惯上用万分率、10万分率等。,（2）构成比（proportion）,又称构成指标，它表示某一事物内部各组成部分所占的比重或分布。常用100为基数，以百分比表示，计算公式为：,一般来说,构成比的总和为100%（亦可表示为1），但有时由于计算尾数取舍的关系，其总和不一定恰好等于100%，需对各构成比的尾数作适当调整，使构成比的总和等于100%。事物各构成部分构成比的大小，受两方面因素的影响，一是该部分自身数值变化的影响,这一影响易被人们所察觉；二是其

22、它部分数值变化的影响,这一影响往往被人们所忽视。,（3）相对比（relative ratio）,相对比是两个有关指标之比。例如，不同地区、不同单位或不同时期的两个有关指标（可以是绝对数、相对数或平均数）之比，可反映两者之间的差别变化情况。相对比通常用百分数（%）或倍数表示。其计算公式为：,3医疗卫生工作中常用相对数指标,1.死亡率或称粗死亡率 2.病死率：3.发病率：4.患病率（或称现患率）,死亡率或称粗死亡率,死亡率或称粗死亡率：表示某地某年每千人口中的死亡人数。常受各地人口、年龄、性别等构成因素的影响，需进行标准化后才能进行相互比较。同年平均人口数以上年末人口数加本年末人口数除以2。,病

23、死率,指在观察期内，某病患者中因该病而死亡的频率。应与死亡率相区别。两者分母不同，计算结果的意义也不同。,发病率,表示一定时期（通常为 1 年）内某人群发生某病新病例的频率。所谓新病例指每发生一种病算一种新病例，如某病治愈后再次发作，算两个新病例。,患病率（或称现患率）,表示某一时点（一般不超过一个月）某人群中患某病的频率。一般用于表示病程长的慢性病存在或流行的频率。,4应用相对数的注意事项,不要混淆率与构成比。计算相对数时分母不宜过小。要注意平均率的计算。两个率或构成比比较时应作假设检验。要注意资料的可比性。,构成比说明某部分占全体的比重，率说明事物发生的概率，两者计算不同，说明的问题

24、也不同，但由于两指标同属于相对数范畴，有时又都用100作基数，所以易于混淆。常见的错误是把构成比当作率来应用。,一般说来，调查和实验观察单位应有足够的数量。观察单位足够时，计算的相对数比较稳定，能够正确反映实际情况。如果观察例数过少，计算的相对数可靠性较差，此时应以绝对数直接表示为好。例如 4 名患者2名治愈，最好用绝对数表示。,计算率的平均值时，不能将各组率相加，然后除以组数。如计算表4-8资料各年龄组人群平均患病率时，不能将各年龄组患病率相加后求平均率，而应该将各年龄组检查人数与病人数分别相加，然后以总病人数除以总检查人数。,两个率或构成比比较时应作假设检验,在抽样研究中，率和构成比也存在

25、抽样误差，所以比较构成比或率时，不能仅凭表面数据直接下结论，应进行差别的显著性检验。,所谓可比性，即除了两者被比较的因素不同以外，其余可能影响结果的因素应尽可能相同或相近。一般应注意：所要比较资料的时间、地点、方法等是否相同；所要比较对象的年龄、性别等因素的构成是否相同，如果要比较组的年龄、性别等构成不同，应计算分年龄组、分性别的率，或者计算标准化率。,二、检验,x2检验是一种用途较广的假设检验方法，常用于计数资料的统计分析。x2检验最常用于比较两个或多个率（或构成比）差别有无显著性。按照设计类型不同，可将x2检验分为四格表资料x2检验、配对资料x2检验等。,（一）四格表资料检验,比较2个样

26、本率之间差别有无统计意义，除了可以用率的u检验外，还可以用四格表资料x2检验。四格表指2行2列组成的的表格，其基本数据只有4个。,1 检验公式,2应用范围和注意事项,表4-10 界值表,（二）配对资料的检验,配对计数资料的两个样本中，实验单位一一配对，或同一实验单位先后给以两种不同处理。1配对x2检验公式,2应用范围和注意事项,第4节统计表与统计图,一、统计表统计表(statistical table)是用表格的形式来表达统计分析的事物及其指标。广义的统计表包括调查资料所用的调查表、整理资料所用的整理汇总表以及分析资料所用的统计分析表等；狭义的统计表仅指统计分析表。,(一)统计表的结构,一

27、张统计表的必备部分通常包括标题、标目、数字和线条，基本格式如下所示：,(二)制表的基本要求,1.标题(title)标题位于表格的上方中央，标题要求简明扼要地说明表的中心内容，必要时注明资料的时间和地点。标题不能过于简略，也不能过于繁琐，更不能无标题或标题不确切。若有两个以上的统计表，在标题的前面应有表序，以备查找。2.标目(heading)标目是说明表中数字含义的部分，分横标目和纵标目。横标目是用来说明表中被研究事物或对象的主要标志，是表的主语，列在表的左侧，说明表内同一横行的含义；纵标目用来说明横标目各种统计指标结果，是表的谓语，列在表的右侧上方，说明表内同一纵列数字的含义。标目不能过多，层

28、次一定要清楚。,3.线条(line)表内只有横线，竖线和斜线一律不要。横线也不宜过多，常用三条基本线表示，即顶线和底线，以及隔开纵标目和数字的一条横线。如有合计，再加一条隔开合计与数字的线。通常顶线和底线略粗一点，另两条线可略细一点。4.数字(figure)表内数字必须准确，一律用阿拉伯数字来表示，所有数字位次对齐，同一指标的小数位数应一致，表内不得留有空格。资料暂缺或未记录用“”表示，未调查、无数字用“”表示，数字若为“0”，则写“0”。5.备注(footnate)不是表的必备部分，当有需要说明的问题时，用“*”号标出，列在表的下方。,（三）统计表的种类,1.简单表(simple table

29、)按一种特征或标志分组，即由一组横标目和一组纵标目组成的统计表。如表4-14。2.复合表(combinative table)按两种或两种以上特征或标志分组，即由两组及两组以上的横标目和纵标目组成的统计表。,（四）统计表的修改,完整的统计表要从表达资料的目的、标题、纵横标目、线条、数字等方面来评价，力求做到简明、直观，便于比较。,二、统计图,统计图(statistical chart)是用点的位置、线段升降、直条长短、面积大小等形式来表达统计分析的结果，反映事物及其指标间的数量关系。统计图比较形象、直观，使读者一目了然，印象清晰。但统计图只能给出概括的印象，不能非常准确地表达数据，一般需要结合

30、文字进行描述。医学统计中常用的有条图、百分条图、圆图、线图、半对数线图、直方图、散点图和统计地图等。,（一）制作统计图的基本要求,1.选图根据资料的性质和分析目的选择合适的图形。2.标题要简明扼要，概括说明资料的主要内容，必要时注明时间、地点；有两个以上图时，标题前面加上图号，编号一般用图加阿拉伯数字表示，标题及图号写在图的正下方。3.标目纵横两轴应有标目，并应注明标目单位。,4.尺度横轴尺度自左而右，纵轴尺度自下而上，数值一律由小到大，等距或有一定的规律性地标明。5.比例除圆形图外，图形的纵横轴比例一般以5：7为宜，过大或过小易造成错觉。6.图例当比较不同地区或同一地区不同时间某

31、一事物的变化情况时，须用不同的线条或颜色表示，并附图例说明。,（二）常用统计图的种类和绘制方法,1.直条图(bar chart)简称条图，是用等宽直条的长短来表示相互独立的各指标的数值大小。如不同的地区、不同的病种、不同的科室、不同的疾病名称等。分单式条图（图4-1）和复式条图（图4-2）两种。,图4-1 某年某地五种恶性肿瘤的死亡专率,图4-2 某医院用两种中药治疗不同类型慢性气管炎的疗效,绘制要点如下,坐标轴：横轴为观察项目，纵轴为数值，纵轴坐标一定要从0开始。直条的宽度：各直条应等宽，等间距，间距宽度和直条相等或为其一半。复式直条图在同一观察项目的各组之间无间距。排列顺序：可以根据数值从

32、大到小，从小到大，或按时间顺序排列。,2.百分条图(percentage bar chart),适用于构成比资料，用来表示全体中各部分所占的比重。绘制要点如下：标尺：一定要有标尺，画在图的上方或下方，起始的位置、总长度和百分条图一致，并和百分条图平行。全长为100%，分成10格，每格10%。分段：按各部分所占百分比的大小排列，可以在图上用数字标出百分比。图例：在图外用附图例说明。多组比较：若要比较的事物不止一个时，可以画几个平行的百分条图，以利于比较。各条图的排列顺序相同，图例相同。,图4-3 某地1995年五种主要死因构成,3圆形图(pie chart),适用的资料、用途和百分直条图相同。以

33、圆形的面积为100%，将百分比转化为角度，把圆形的面积按比例分成若干部分，以角度大小来表示各部分所占的比重。绘制要点如下：由于圆周为360度，以每1%相当于3.6度的圆周角，将百分比乘3.6度即为所占扇形的度数。用量角器画出。从相当于时钟12点或9点的位置开始顺时针方向绘图。每部分用不同线条或颜色表示，并在图上标出百分比，并附图例说明。当比较不同资料的百分构成时，可以画两个相等大小的圆，在每个圆的下面写明标题，并用相同的图例表示同一构成部分。,图4-4 某地1995年五种主要死因构成,4线图(line diagram),以线段的上升或下降来表示事物在时间上的发展变化或一种现象随另一种现象变迁

34、的情况，适用于连续性资料。绘制要点如下：横轴表示某一连续变量（时间或年龄），纵轴表示某种率或频数。数据点画在组段中间位置。相邻的点用直线连接，不能任意改为光滑曲线。同一张图不要画太多条线，否则不易分清。当有两条或两条以上曲线在同一张线图上时，须用不同颜色或不同的图形形式加以区分，并附图例加以说明。图4-5按表4-21资料绘制。,图4-5 某地1981-1990年某传染病病死率,5直方图(histogram),以各矩形的面积来代表各组频数的多少，适用于连续变量的频数分布。绘制要点如下：坐标轴：横轴代表变量值，要用相等的距离表示相等的数量。纵轴坐标要从0开始。各矩形间不留空隙。对于组距相等的资料

35、可以直接作图；组距不等的资料先进行换算，全部转化为组距相等的频数，用转化后的频数作图。,图4-6 某年某地100名成年男子血清总胆固醇频数分布图,小结,本章主要介绍了人群健康研究的统计方法。具体内容包括统计工作的四大基本步骤，即统计设计、搜集资料、整理资料和分析资料；统计中关于总体和样本、抽样误差、资料的类型、概率等基本概念，数值变量资料表示集中趋势的指标：算术均数、几何均数和中位数的计算及应用；表示离散趋势的指标：全距、方差、标准差和变异系数；两均数比较常用的假设检验方法：t检验；分类变量资料常用统计指标：率、构成比、相对比的意义和计算；,医疗卫生工作常用相对数指标：发病率和患病率，病死率和死亡率。分类变量资料常用的统计分析方法：四格表资料检验和配对资料检验；统计表的编制要求及常用统计图中直条图、构成图、线图、直方图等的绘制。对应于本章的内容，编制了三个实习，供学生选择练习，以加深对本章内容的理解和掌握。,思考题,统计资料的类型分哪几种？请举例说明资料的性质。结合生活实际，正确理解“小概率事件”概念。区别三种均数的适用范围。说出标准差和变异系数的区别。试述t检验的适用范围及其注意事项。说出常用相对数的种类和应用注意事项。区别一般四格表和配对四格表。什么是统计表？其基本格式与要求有哪些？如何根据资料的性质和分析目的选择合适的统计图？,