总体均数估计与假设检验及t检验.ppt

上传人：小飞机

文档编号：5730821

上传时间：2023-08-15

格式：PPT

页数：95

大小：680.50KB

《总体均数估计与假设检验及t检验.ppt》由会员分享，可在线阅读，更多相关《总体均数估计与假设检验及t检验.ppt（95页珍藏版）》请在三一办公上搜索。

1、定量资料的统计推断,在医学科研当中，常常要利用抽样研究的方法，通过对总体中部分样本的研究来估计总体。这种用样本的指标来推断总体的方法，统计上叫做“统计推断”，统计推断的方法是我们统计工作中最常用的方法。,参数估计假设检验,统计推断的内容,参数估计,均数的抽样误差和标准误 t分布总体均数的估计,既然是抽样研究，那么就一定存在着抽样误差（由于个体变异），每次抽到的样本均数之间或者样本均数与总体均数之间都不尽相同，总是有差别的。因此，估计抽样误差的大小，就成为统计推断必须要解决的问题。,一、均数的抽样误差和标准误：,假设一个已知总体，从该总体中重复抽取样本量相等（为m）的样本n次，对每个样本计算

2、样本统计量(均数、方差等)，观察n个样本统计量的分布规律抽样分布规律。考察：不同的分布-正态分布、偏态分布不同的样本含量,抽样试验,由中心极限定理及大数定理得出：若原变量X服从正态分布，随机抽取样本含量为n的样本均数也服从正态分布。即使从偏态总体中随机抽样，当n足够大（n50），样本均数也近似服从正态分布。这个定理不仅具有理论价值，而且具有很高的实用价值。因为在实际工作当中，许多医学测量结果并不知道它的确切分布，有了这个性质，就可以利用正态分布的原理对其特征进行统计推断。,样本均数的分布：,从正态分布总体N（5.00,0.502）中，每次随机抽取样本含量n5，并计算其均数与标准差；重复抽取1

3、000次，获得1000份样本；计算1000份样本的均数与标准差，并对1000份样本的均数作直方图。按上述方法再做样本含量n10、样本含量n30的抽样实验；比较计算结果。,抽样试验（n=5）,抽样试验（n=10）,抽样试验（n=30）,3个抽样实验结果图示,样本均数的抽样分布特点,各样本均数未必等于总体均数；样本均数之间存在差异；样本均数的分布很有规律，围绕着总体均数，中间多、两边少，左右基本对称，也服从正态分布；样本均数的变异较原变量的变异大大缩小。随着样本含量的增加，样本均数的变异范围逐渐缩小。,均数的标准误（standard error of mean）：,样本均数之间的差异，反映了样本均

4、数的离散程度，即为抽样误差。这时的样本均数的标准差，称为样本均数的标准误，简称标准误。,标准误的概念,抽样的样本量越大，标准误就越小；原来总体变异度小，标准误就越小。标准误反映了样本均数间的离散程度，也反映了样本均数与总体均数之间的差异。当标准误大时，用样本均数对总体均数的估计的可靠程度就小；反之亦然。,标准差与标准误,意义：标准差用于描述个体值之间的变异，即观察值间的离散度，标准差小，表明观察值围绕均数的波动小；标准误描述统计量的抽样误差，即样本统计量与总体参数的接近程度。标准误小，表明抽样误差小，则统计量稳定，与参数接近。用途：标准差表示观察值间波动的大小，用于医学参考值范围；标准误表示抽

5、样误差的大小，用于参数估计。关系：随着样本含量增加，都减小。联系：都是表示变异度的指标，当样本量一定时，两者成正比。,标准误用途,衡量样本均数的可靠性：标准误越小，表明样本均数越可靠；参数估计：估计总体均数的置信区间（区域）；假设检验：用于总体均数的假设检验（比较）。,t-分布,t-distribution,t 分布的概念,用样本方差代替总体方差，此时不再服从正态分布。而服从 t 分布。记为：,开创了小样本统计的新纪元，t分布主要用于总体均数的区间估计和t检验！,t分布曲线,t 分布有如下性质：单峰分布，曲线在t0 处最高，并以t0为中心左右对称与正态分布相比，曲线最高处较矮，两尾部翘得高（见

6、绿线）随自由度增大，曲线逐渐接近正态分布；分布的极限为标准正态分布。,t分布曲线下面积（附表2）,双侧t0.05/2，92.262 单侧t0.025，9单侧t0.05，91.833双侧t0.01/2，93.250 单侧t0.005，9单侧t0.01，92.821双侧t0.05/2，1.96 单侧t0.025，单侧t0.05，1.64,三、总体均数的估计：,是一种参数估计，是统计推断的一个重要方面。是指用样本指标（称为统计量）估计总体指标（称为参数），这里我们主要介绍总体均数的估计。估计方式有点估计（point estimation）和区间估计（interval estimation）两种。1点

7、值估计：是用样本统计量直接作为总体参数的估计值，这种方法虽简单，但未考虑抽样误差，一般不用。2区间估计：是按一定的概率如95%估计总体均数所在的范围，即总体均数的可信区间或置信区间，通常用样本均数和均数的标准误来估计。估计方法：,总体均数估计方法,总体均数的估计：,点值估计（point estimation）：例，120名成年男子血清铁含量的均数是18.57。那么，该总体范围（这个地区）的成年男子血清铁含量的均数就是18.57。这种方法虽简单，但未考虑抽样误差，一般不用。,区间估计（interval estimation),也称置信区间。利用样本信息给出一个区间，并同时给出按预先给定的概率估计

8、该区间包含总体均数的可能范围。,可信度：给定的概率称为可信度。用表示。通常取99%、95%。,t分布方法,应用条件：总体方差未知，样本量小,例某医师测的40名老年性慢性支气管炎病人尿中17-酮类固醇排出量均数为15.19umol/d，标准差为5.03umol/d，试估计该种病人尿17-酮类固醇排出量总体均数的95%可信区间。,分析条件：总体方差未知，样本量小,（13.5816.80）,正态分布近似法,应用条件：当总体标准差已知时；或总体标准差未知，而样本量较大时（n50),例4.3 某市随机抽查12岁男孩100人，得身高均数139.6cm，标准差6.85cm。计算该地12岁男孩身高均数的9

9、5%的可信区间。,分析条件：总体方差未知，但样本量大，用正态分布法,(-0.79,7.21),可信区间的意义：用样本均数估计出一个总体均数的范围，可信的程度有95%。也就是说总体均数落在这个范围的可能性有95%。从理论上讲，这样估计100次，约有95次是对的，也就是总体均数在这个范围的可能性是95%，约有5次是不对的，也就是总体均数没有在这个范围的可能性是5%。,例题：随机抽样调查1998年某市区232例足月龄正常女婴的出生体重，结果见下表，试估计1998年该市区正常女婴的出生体重均数所在范围。,假设检验的推断原理假设检验的基本步骤 t检验和Z检验两样本总体方差齐性检验正态性检验假设检

10、验的两类错误注意事项,假设检验（Hypothesis test）,一、假设检验的推断原理,上面介绍过的区间估计方法是统计推断的内容之一(对总体参数做估计)，假设检验是统计推断的另一重要内容(对总体参数做比较)。正是应用统计推断的理论和方法，人们才能顺利地通过有限的样本信息去把握总体特征，实现抽样研究的目的。,假设检验是对所估计的总体首先提出一个假设(即假设样本来自这个总体)，然后通过样本数据去推断是否拒绝这一假设，如果拒绝，认为该样本很可能不是来自这个总体；否则，认为该样本很可能来自这个总体。,例，某医生测量了36名从事铅作业男性工人的血红蛋白含量，算得其均数为130.83g/L，标准差为2

11、5.74g/L。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值140g/L？,由上面的例子可以看出，需要检验两个方面：与正常人群相同，均数之间的差别是由于抽样误差所致，抽样误差影响的可能性大，其它因素影响的可能性小。与正常人群不同，是由于从事铅作业环境条件的影响，抽样误差影响的可能性小。那么，如何进行判断呢？统计上就是以抽样误差发生的可能性，也就是以小概率事件发生来判断。,假设检验通过对假设作出取舍抉择来达到解决问题的目的A.从事铅作业男性工人血红蛋白含量的总体均数与一般成年男子的相等无差异假设、零假设 H0（null hypothesis）B.从事铅作业男性工人血红蛋白含量的总体均

12、数与一般成年男子的不相等对立假设、备择假设 H1（alternative hypothesis）,证明A还是证明B？在H0成立的条件下，均数之间的差异是由抽样误差引起的，有规律可循；在H1成立的条件下，均数间的不同包含种种未知情形，无规律可循。故从H0成立的角度出发，寻求其成立的概率。,变量值（血红蛋白）X服从正态分布，且为小样本，假定H0成立，样本均数服从t-分布，则在H0成立的前提下，当前t值出现的概率有多大？,如何给出这个量的界限？,小概率事件在一次试验中基本上不会发生！,从附表2中查出在显著性水平=0.05（双侧），自由度为35所对应的t界值=2.318，即为拒绝域与接受域的界限。如

13、果计算出的t统计量大于相应的t界值，则落在拒绝域中，该统计量出现的概率小于5%，为小概率事件。,-2.318,2.318,接受域,拒绝域,拒绝域,常取,的选择要根据实际情况而定,通常取0.05,检验水准的概念,在假设检验中，称预先规定的小概率值为检验水准，也称为显著性水准，用表示。,这里所依据的逻辑是：,如果H0 是成立的，那么衡量差异大小的某个统计量落入区域拒绝域是个小概率事件。如果该统计量的实测值落入拒绝域，也就是说，H0 成立下的小概率事件发生了，那么就认为H0不可信而否定它。否则我们就不能否定H0（只好接受它）.,1.建立检验假设，确定检验水准；H0：零假设、无效假设。是与研究假设

14、有关的、被推断特征某种确定的关系；H1：备择假设、对立假设。是被推断总体特征的另一种关系或状况，与H0既有联系又互相对立。检验水准，将小概率事件具体化，即规定概率不超过就是小概率。2.根据试验设计、资料类型、统计方法的条件选择检验方法，计算相应的统计量；3.确定P值，下结论。,假设检验的基本步骤：,3确定P值，下结论.根据P值大小，在两个假设之间进行二者取一的选择。规则是：如果P（0.05），意味着在H0设定的前提下发生了（支持H0的）小概率事件。怀疑H0的真实性（即推测实际情况应为H1）。从而做出拒绝H0，接受H1的推断结论。如果P（0.05），按照事先确定的标准，在H0的前提下没有发生（

15、支持H1的）小概率事件，因而没有充足的理由对H0提出怀疑。于是做出不拒绝H0的推断结论。无论做出哪一种推断结论，都面临着发生判断错误的风险。这就是假设检验的两类错误。,t 检验,t-test,三、t检验和Z检验（参数检验）,以t分布为基础的检验称为t检验。t分布的发现使得小样本统计推断成为可能。因而，它被认为是统计学发展历史中的里程碑之一。在医学统计学中，t检验是重要的假设检验方法之一。常用于两个均数之间差别的比较，并根据资料的分布情况及设计类型，选择不同的t检验方法。,本章结构,单个样本t检验配对样本t检验两独立样本t检验t检验中的注意事项假设检验中两类错误,单样本t检验,One sampl

16、e t-test,试验设计一组样本均数（代表未知总体均数）与已知总体均数（一般为理论值、标准值或经过大量观察所得稳定值等）的比较。,应用条件：样本来自正态分布的总体！,例：根据大量调查，已知健康成年男子的脉搏均数为72次/分。某医生在某山区随机调查30名健康男子，求得脉搏均数为74.2次/分，标准差为6.5次/分。能否认为该山区的成年男子的脉搏均数高于一般成年男子的脉搏均数？,建立检验假设，确定检验水准；确定检验方法，计算统计量；确定P值，下结论。查附表2，t界值为2.045，统计量小于界值，则P0.05。拒绝H1，接受H0，差异无统计学意义。尚不能认为该山区成年男子脉搏数与一般男子不同。,

17、配对样本t检验,Paired design t-test,试验设计配对设计将受试对象按照某些重要特征（主要是非处理因素）配成对子，每对中的两个受试对象随机分配到两处理组。特点控制较多的个体变异，可比性好，常用于个体变异较大的资料。类型将受试对象配成特征相近的对子，随机接受两种处理；同一受试对象或同一份样品分成两份，随机分别接受不同处理；同一受试对象处理前后的结果比较。,12名儿童分别用两种结核菌素的皮肤浸润反应结果(mm),12名接种卡介苗的儿童，8周后用两批不同结核菌素，一批是标准结核菌素，一批是新制结核菌素，分别注射在儿童的前臂，两种结核菌素的皮肤浸润反应平均直径如下表，问两种结核菌

18、素的反应性有无差别？,配对设计下的数据具有一一对应的特征，人们关心的变量是对子的效应差值而不是各自的效应值。把两种处理后的数据之差看作处理效果的一个样本，假定这种差值服从正态分布，那么其总体均数为0，即表明该处理没有作用。问题转化为单组完全随机化设计资料总体均数为零的检验。,应用条件：差值服从正态分布！,建立检验假设，确定检验水准；计算统计量；3.确定P值，下结论。,假设检验的步骤,两种方法对乳酸饮料中脂肪含量的测定结果(%),两独立样本t检验,Two independent sample t-test,试验设计完全随机设计将受试对象完全随机地分配到两组中，分别接受不同的处理；或者从两个总

19、体完全随机地抽取一部分个体进行研究。目的:比较两总体均数是否相同。特点设计简单易行。常用于个体变异较小、同质性较好的资料。,应用条件,两样本含量较小（n60）；两样本来源于正态分布的总体；两总体方差相同，即方差齐性。独立样本。,方差齐性检验(homogeneity of variance test),查附表3F界值表。,附表3,方差齐性时,方差不齐时,检验统计量为：,校正临界值为：,有25例糖尿病患者随机分成2组，甲组单纯用药物治疗，乙组采用药物治疗合并饮食疗法，2个月后测空腹血糖(mmol/L),问两组血糖值是否相同？,t=2.639,t0.05(23)=2.069,15.21,10.85

20、,有两组小白鼠分别饲以高蛋白和低蛋白饲料，4周后记录小白鼠体重增加量(g)如下表，问两组动物体重增加量的均数是否相等？,完全随机设计两样本几何均数比较的t检验,基本思想：某些资料不服从正态分布，两样本所代表的总体方差也可能不齐，但进行变量变换后（对数变换），则服从正态分布，相应的两总体方差也可能具有齐性。数据变换后两组间的关系并没有改变。,选甲型流感病毒血凝抑制抗体滴度(倒数)小于5者24人，随机分为2组，每组12人。用甲型流感病毒活疫苗进行免疫，一组用气雾法，另一组用鼻腔喷雾法，免疫一个月后，分别测定血凝抑制抗体滴度，结果如下表，问两种方法免疫的效果有无差别？,Z检验：这里，当样本含量较大时

21、，t分布临界值接近Z分布临界值，可用1.96或1.645来代替。这就是所谓的Z检验。,建议：不管大样本，小样本，均用t检验！,五、正态性检验,进行t检验的各种资料，必须满足符合正态分布的总体，若不能满足该条件，就不能进行t检验。,正态概率纸法：以变量量纲的刻度（组段）为横坐标，以概率单位（相应频率转换）为纵坐标，将数据在直角坐标平面描点，为正态概率纸法。如果数据服从正态分布，所描出的散点（尤其是中间的点）沿一直线分布。,P-P图法：以样本的实际累计频率作为横坐标，以按照正态分布规律计算的相应的理论累计概率作为纵坐标，把样本点在直角坐标平面中。所得到的点图就是P-P图。如果资料服从正态分布，样本

22、点应围绕第一象限的对角线散布。Q-Q图法：以样本的实际分位数（PX）作为横坐标，以按照正态分布规律计算的相应的理论分位数作为纵坐标，把样本点在直角坐标平面中。所得到的点图就是Q-Q图。如果资料服从正态分布，样本点应围绕第一象限的对角线散布。目前流行的统计学软件主要提供P-P图或Q-Q图。,统计检验法：W检验（S.S.Shapiro and M.B.Wilk）：统计量为W 值。D检验（DAgostino）：统计量为D值。矩法峰度与偏度检验、皮尔逊拟合优度检验等，也可以用于正态性检验。,25例正常人TL-6资料的P-P图,综合上述：t检验的应用条件是：正态总体方差齐性（完全随机设计的资料）,七、

23、应用假设检验需要注意的问题：,1严格按照研究设计方案，收集客观的数据；样本的获取必须遵循随机的原则。2应用检验方法必需符合其适用条件。3正确理解差别有无统计意义。4结论不能绝对化 5.权衡两类错误的危害来确定的大小。6对均数或概率作假设检验时，应与总体参数的区间估计结合进行。7作假设检验应注意样本容量是否合理。,假设检验的前提是要有严密的抽样研究设计,这是假设检验的前提。组间应均衡，具有可比性，也就是除对比的主要因素(如临床试验用新药和对照药)外，其它可能影响结果的因素(如年龄、性别、病程、病情轻重等)在对比组间应相同或相近。保证均衡性的方法主要是从同质总体中随机抽取样本，或随机分配样本。,选

24、用的假设检验方法应符合其应用条件,应根据分析目的、资料类型以及分布、设计方案的种类、样本含量大小等选用适当的检验方法。如：配对设计的计量资料采用配对t检验。而完全随机设计的两样本计量资料，若为小样本且方差齐，则选用两样本t检验；若方差不齐，则选用近似t检验(Cochran&Cox法或Satterthwaite法)。若为大样本，则可选用大样本u检验。,正确理解差别有无统计意义,统计“显著性”与医学/临床/生物学“显著性”统计“显著性”对应于统计结论，而医学/临床/生物学“显著性”对应于专业结论。假设检验是为专业服务的，统计结论必须和专业结论有机地相结合，才能得出恰如其分、符合客观实际的最终结论。

25、若统计结论和专业结论一致，则最终结论就和这两者均一致(即均有或均无意义)；若统计结论和专业结论不一致，则最终结论需根据实际情况加以考虑。若统计结论有意义，而专业结论无意义，则可能由于样本含量过大或设计存在问题，那么最终结论就没有意义。,正确理解差别有无统计意义,例如：有人欲比较A、B两种降压药物的降压效果，随机抽取了高血压病人各100名，分别测定两组病人服药后舒张压的改变值，得两组舒张压改变值之差的平均数为0.83 mmHg(0.11kPa)。作两大样本u检验得u=6.306，P0.001，有统计学意义。但因A、B两组高血压病人服药后舒张压改变值之差较小，仅0.83 mmHg，未达到有临床意义

26、的差值5mmHg(0.67kPa)，故最终结论没有意义。相反，若统计结论无意义，而专业结论有意义，那就应当检查设计是否合理、样本含量是否足够。,结论不能绝对化,因统计结论具有概率性质，故“肯定”、“一定”、“必定”等词不要使用。在报告结论时，最好列出检验统计量的值，尽量写出具体的P值或P值的确切范围，如写成P=0.040或0.02P0.05，而不简单写成P0.05，以便读者与同类研究进行比较或进行循证医学时采用Meta分析。,假设检验中单侧检验与双侧检验,1.699,假设检验与可信区间的关系,可信区间具有假设检验的主要功能可信区间可提供假设检验没有提供的信息假设检验提供区间估计所不能提供的信息

27、,例4.4 根据大量调查，已知健康成年男子的脉搏均数为72次/分。某医生在某山区随机调查30名健康男子，求得脉搏均数为74.2次/分，标准差为6.5次/分。能否认为该山区的成年男子的脉搏均数高于一般成年男子的脉搏均数？,用区间估计的方法：,由于95区间估计包含了健康成年男子的脉搏均数72，故可以认为该山区30名成年男子脉搏的总体均数与健康成年男子的脉搏均数来源于同一总体，两者的总体均数相等与假设检验的结果是相同的,由于假设检验是根据有限的样本信息对总体作推断，不论做出哪一种推断结论都有可能发生错误。这就是假设检验的两类错误。,六、假设检验的两类错误：,类错误：如果实际情况与H0一致，仅仅由于抽

28、样的原因（偶然性），使得统计量的观察值落到拒绝域（t值较大），从而实际上成立的H0遭到拒绝，导致推断结论错误。这样的错误称为类错误。类错误：如果实际情况与H0不一致，也仅仅是抽样的原因，使得统计量的观察值落到接受域，从而实际上不成立的H0未被拒绝，则导致了另一种推断错误。这样的错误称为类错误。,两类错误的关系：犯类错误的概率不会超过检验水准。犯类错误的概率用表示。因为在H0不成立时，检验统计量的精确分布往往难以确定，所以在多数情况下准确估计的数值比较困难，因此类错误的概率是未知的：P=。对于某一具体的检验来说，当样本容量n一定时，越小越大；越大越小。在实际应用中，往往通过去控制。在样本量确定时，如果要减小，就把取大一些；若要同时减小I型错误和II型错误唯一办法就是增大样本含量。,假设检验的功效：1-称为假设检验的功效（power of a test）。其意义是：当所研究的总体与H0确有差别，而满足H1时，按检验水平能够识别的概率。如果1-=0.90，则意味着H0当成立时，理论上在每100次抽样中，在的检验水准上平均有90次能识别它。一般情况下对同一检验水准（不变），功效大的检验方法更可取。,