人群健康研究的统计学方法计量资料的统计推断.ppt
计量资料的统计推断,总体均数的估计总体均数的假设检验,第一节 总体均数的估计,均数的抽样误差与标准误 u、t分布 总体均数的估计,为什么进行抽样?,均数的抽样误差,概念:抽样引起的总体参数与样本统计量之间的差异称为抽样误差(sampling error)。均数的抽样误差:抽样引起的样本均数与总体均数的差异称为均数的抽样误差。,欲了解某地成年男子血红蛋白含量总体均数?,样本均数 样本1 样本2 样本k 各样本均数相不相同?为什么?,总体,数理统计的中心极限定理,从正态分布N(,2)中,以固定n抽取样本,样本均数的分布仍服从正态分布;即使是从偏态分布总体抽样,只要n足够大,的分布也近似正态分布;样本均数的总体均数仍为,样本均数的标准差为。,标准误(standard error),样本均数的标准差称标准误,是说明均数抽样误差大小的指标,大,抽样误差大;反之,小,抽样误差小。标准误 的计算:标准误 的估计值:,影响标准误大小的因素,的大小与成正比 与样本含量n的平方根成反比,表8.1 模拟结果100个样本均数,t分布,t分布的由来t分布的特征t分布曲线下的面积,t分布的由来,变量变换,总体,样本均数,中心极限定理,标准正态分布,变量变换,未知,如果抽取例数n=5的样本k个,每个样本又都可以按公式(13.4)计算出一个t值,可将k个t值编制成频数表,作出直方图,当k无限增大时,则可得到一条光滑的曲线。(式13.4)同理,如果抽取例数n=15时,仍能得到一条t分布曲线,因此,当n变化时,就可以得到不同的t分布曲线,如图13-1:,图13-1 自由度分别为1、5、的t分布,自由度,随机变量能够自由取值的个数=n-限制条件的个数,t分布的特征,t分布是一簇单峰分布曲线。t分布以0为中心,左右对称且均匀下降。其形态变化与自由度的大小有关。自由度越小,则t值越分散,曲线越低平;自由度逐渐增大时,t分布逐渐逼近u分布(标准正态分布);当=时,t分布即为u分布。,t分布曲线下面积规律,t分布曲线下总面积仍为1或100%t分布曲线下面积以0为中心左右对称。由于t分布是一簇曲线,故t分布曲线下面积固定面积(如95%或99%)的界值不是一个常量,而是随自由度的大小而变化,如附表二。,附表二,t分布表的特点,附表二的第一列为自由度,其余各列为概率P,表中数值为其相应的t界值,记作t,。附表二只列出正值,若计算的t值为负值时,可用其绝对值查表。附表二右上附图的阴影部分表示t,以外尾部面积的概率。,单侧t0.05,30=1.697,其通式为单侧:P(t-t,)=或P(tt,)=双侧:P(t-t/2,)+P(tt/2,)=图中非阴影部分面积的概率为,P(-t/2,tt/2,)=1-,总体均数的估计,用样本指标估计总体指标称为参数估计,是统计推断的一个重要方面。总体均数估计的两种方法点估计:是直接用统计量估计总体参数.区间估计:由于抽样误差的客观存在,因而按一定的概率(100(1-)%)估计总体均数所在的范围(亦称可信区间)。,点估计,11名18岁男大学生身高均数资料得,=172.25cm,s=3.31cm,试估计该地18岁男大学生身高总体均数?答:该地18岁男大学生身高总体均数为172.25cm,区间估计,概念:即按预先给定的概率(100(1-)%)估计参数所在的范围。该范围亦称可信区间或置信区间。,在 到 之间的概率为1-。,在 到 之间的概率为1-。,可信区间的计算,未知,且n小 未知,但n足够大 已知,例:为了解某地1岁婴儿的血红蛋白浓度,从该地随机抽取了1岁婴儿25人,测得其血红蛋白的平均数为123.7g/L,标准差为11.9g/L。试估计该地1岁婴儿的血红蛋白的平均浓度。,故该地1岁婴儿血红蛋白平均值95%的可信区间为(118.79,128.61)g/L。,例 某地抽得正常成人200名,测得其血清胆固醇的均数为3.64mmol/L,标准差为1.20mmol/L,试估计该地正常成人血清胆固醇均数的95%可信区间。,故该地正常成人血清胆固醇均数的95%可信区间为(3.47,3.81)mmolL。,例13.3 某地150名3岁女孩平均身高为92.8cm,标准误为0.38cm,试估计该地3岁女孩身高总体均数的95%可信区间。,该地3岁女孩身高总体均数的95%可信区间为(92.1,93.5)cm。,可信区间有两个要素,准确度:反映在可信度(1-)的大小上,即可信区间包含总体均数的可能性大小,从准确度的角度看,愈接近1愈好,如可信度99%比95%好。精密度:反映在可信区间的长度上,即长度愈小愈好。在抽样误差确定的情况下,二者是相互矛盾的,若提高了可信度,可信区间势必增大,精密度下降。因此,需要同时兼顾准确度与精密度,一般情况下,常用95%可信区间。,第二节 假设检验,假设检验(hypothesis test)亦称显著性检验(significance test),是统计推断的另一个重要方面。,例 据大量调查知,健康成年男子脉搏的均数为72次/分,某医生在山区随机调查了25名健康成年男子,其脉搏均数为74.2次/分,标准差为6.5次/分,能否认为该山区成年男子的脉搏高于一般人群?,两均数不相等的原因有两种可能:由于抽样误差所致。样本来自另一总体(由于环境条件的影响,山区成年男子的脉搏确实高于一般)。,假设:山区成年男子平均脉搏数与一般人群相等 在已知总体中进行抽样,能得到这个样本的概率P为多少?通过t界值表可以确定P值,如果P是个小概率,则可认为假设不成立,反之亦然,已知总体72次/分,样本,假设检验的基本思想,小概率反证法,假设检验的基本步骤,建立检验假设,确定检验水准 选定检验方法,计算检验统计量 确定P值,作出统计推断,建立检验假设,确定检验水准,假设有两种:一是无效假设(null hypothesis)或称零假设,用H0示之;二是备择假设(alternative hypothesis),用H1示之。H0和H1都是根据统计推断的目的提出的对总体特征的假设,是相互联系且对立的一对假设。建立假设前,先要根据分析目的和专业知识明确单侧检验还是双侧检验。,如何确定单侧检验还是双侧检验,样本均数(其总体均数为)与已知总体均数0的比较 目的 H0 H1双侧检验是否0=0 0单侧检验是否0=0 0或是否0=0 0,检验水准,检验水准(significance level),符号为,常取0.05。检验水准应在设计时根据专业知识和研究目的预先确定单侧检验或双侧检验以及检验水准,不能在假设检验结果得出后再加以选择。,选定检验方法,计算检验统计量,根据分析目的、设计类型和资料类型,选用适当的检验方法,计算相应的统计量。如配对设计的两样本均数的比较用配对t检验等。,确定P值,作出统计推断,P值是指在H0所规定的总体中随机抽样,获得等于及大于(或等于及小于)现有样本统计量的概率。,t0.05,24=1.711,结论若P,表示在H0成立的条件下,出现等于及大于现有统计量的概率是小概率,按小概率事件原理现有样本信息不支持H0,因而拒绝H0。因此,当P时,按所取检验水准,拒绝H0,接受H1。若P时,表示在H0成立的条件下,出现等于及大于现有统计量的概率不是小概率,现有样本信息还不足以拒绝H0。,结论若P,拒绝H0,可以认为有差异。若P时,不拒绝H0,尚不能认为有差异。,例13.6,20例长期服用某种避孕药的妇女,其血清胆固醇的均数为6.0mol/L,一般健康妇女血清胆固醇的均数为4.4 0mol/L,问长期服用该种避孕药的妇女其血清胆固醇的均数与一般健康妇女有无差别?,其分析目的是推断样本所代表的未知总体均数与已知总体均数0有无差别。,1.样本均数与总体均数比较(例13.6),(1)建立检验假设,确定检验水准 H0:=0 H1:0 单侧=0.05(2)计算统计量(3)确定P值,作出统计推断 查附表2,t界值表,P0.01,按=0.05水准拒绝H0,可以认为长期服用该种避孕药的妇女其血清胆固醇的均数与一般健康妇女有差别。,例13.4 某市某年抽查了100名2岁男孩的体重,得平均体重为11.18kg,标准差为1.23kg。而同期全国九城市大量同龄男孩的平均体重为11kg(此调查结果可作为总体均数)。问该市2岁男孩的平均体重与全国的同期水平有无差别?,配对计量资料的均数比较,在医学科学研究中的配对设计主要有以下情况:同一受试对象处理前后的数据配对的两个受试对象分别接受两种处理之后的数据;同一样品用两种方法(或仪器等)检验的结果;同一受试对象两个部位的数据。其目的是推断两种处理(或方法)的结果有无差别。,例13.7 对8名某病患者用药治疗,测得治疗前后的血沉(mm/h),结果如表13-4,问该药是否对血沉有影响?,表13-4 某病治疗前后的血沉(mm/h),(1)建立假设检验,确定检验水准H0:该药对血沉无影响,即d=0 H1:该药对血沉有影响,即d0 双侧=0.05(2)计算统计量=n-1=8-1=7(3)确定P值,作出统计推断 查附表2,t界值表,得P0.01,按=0.05水准拒绝H0,可以认为该药对血沉有影响。,例 某医生测得18例慢性支气管炎患者及16例健康人的尿17酮类固醇排出量(mg/dl)分别为X1和X2,试问两组的均数有无不同。X1:3.14 5.83 7.35 4.62 4.05 5.08 4.98 4.22 4.35 2.35 2.89 2.16 5.55 5.94 4.40 5.35 3.80 4.12 X2:4.12 7.89 3.24 6.36 3.48 6.74 4.67 7.38 4.95 4.08 5.34 4.27 6.54 4.62 5.92 5.18,(1)建立假设检验,确定检验水准H0:1=2,即两总体均数相等H1:12,即两总体均数不相等双侧=0.05,两样本均数的比较,(2)计算统计量,(3)确定P值,作出统计推断 查附表2,t界值表,得0.10P0.05,按=0.05水准不拒绝H0,尚不能认为慢性支气管患者尿17酮类固醇的排出量与健康人不同。,例13.8:某医师在某克山病区分别检测急性克山病患者与健康人的血磷值,得11名克山病患者血磷值的均数为1.521mmol/L,标准差为为0.422mmol/L;13名健康人血磷值的均数为1.085mmol/L,标准差为为0.422mmol/L,问该地急性克山病患者与健康人的血磷值是否相同?,(1)建立假设检验,确定检验水准H0:1=2,即两总体均数相等H1:12,即两总体均数不相等双侧=0.05,(2)计算统计量,(3)确定P值,作出统计推断 查附表2,t界值表,得0.05P0.01,按=0.05水准拒绝H0,可以认为该地急性克山病患者与健康人的血磷值不同。,u检验,两大样本均数比较,可用u检验,(1)建立检验假设,确定检验水准 H0:=0 该市2岁男孩平均体重与全国同期水平相等 H1:该市2岁男孩平均体重与全国同期水平不等 单侧=0.05(2)计算统计量(3)确定P值,作出统计推断 查附表2,t界值表,P0.05,按=0.05水准不拒绝H0,尚不能认为该市2岁男孩平均体重与全国同期水平不等。,例 某地抽样调查了部分健康成人的红细胞数,其中男性360人,均数为4.6601012/L,标准差为0.5751012/L;女性255人,均数为4.1781012/L,标准差为0.2911012/L,试问该地男、女平均红细胞数有无差别?,(1)建立假设检验,确定检验水准 H0:1=2,即该地男、女平均红细胞数相等。H1:12,即该地男、女平均红细胞数不等。双侧=0.05(2)计算统计量(3)确定P值,作出统计推断 查附表2,t界值表(=时),得P0.001,按=0.05水准拒绝H0,接受H1,可认为该地男女红细胞数的均数不同,男性高于女性。,u检验为t检验在样本含量较大时的近似计算法,t检验的应用条件:,未知且n较小时,要求样本来自正态分布总体;两样本均数比较时,还要求两样本所属总体的方差相等。,相同,不同,I 型错误与II 型错误,拒绝了实际上成立的H0,这类“弃真”的错误为I 型错误(type I error);不拒绝实际上不成立的H0,这类“存伪”的错误为II 型错误(type II error)。,客观实际 拒绝H0 不拒绝H0 H0成立 I 型错误()推断正确(1-)H0不成立 推断正确(1-)II 型错误(),X,=0,X,0,检验效能,1-称为或把握度(power of a test),其统计学意义是若两总体确有差别,按水准能检出其差别的能力。值的大小很难确切估计,只有在已知样本含量n、两总体参数差值以及所规定的检验水准的条件下,才能估算出大小。,,的关系,通常当n固定时,愈小,愈大;反之,愈大,愈小。增大n,可同时减小,。,假设检验中的注意事项,要保证组间的可比性 要根据研究目的、设计类型和资料类型选用适当的检验方法 正确理解差别有无显著性的统计学意义 结论不能绝对化 单、双侧检验应事先确定,比较下面三种说法若P,拒绝H0,可以认为有差异。若P,拒绝H0,可以认为差异有显著性。若P,拒绝H0,可以认为差异有统计学意义。“有显著性”不是指两组均数差异较大,标准差和标准误的区别,标准差(s)标准误()计算公式 应用表示观察值的变异程度 估计均数的抽样误差的大小计算变异系数 估计总体均数可信区间确定医学参考值范围 进行假设检验 计算标准误,均数可信区间与参考值范围,