《单因素方差分析级硕士生 ppt课件.ppt》由会员分享,可在线阅读,更多相关《单因素方差分析级硕士生 ppt课件.ppt(112页珍藏版)》请在三一办公上搜索。
1、标准运行管理科 冯 丹2014年11月20日,Email:TEL:13501237620,第六章 定量资料的方差分析,主要内容,2023/7/8,中国人民解放军总医院 标准运行管理科,2/110,复 习,1.卫生统计学中变量分类?,分类变量,定量变量,二分类变量,无序多分类变量,有序多分类变量,离散型变量,连续型变量,2023/7/8,3/110,中国人民解放军总医院 标准运行管理科,复 习,2.卫生统计学核心内容?,统计推断,即由样本推知总体,1.参数估计:通过抽样来估计总体参数,包括总体均数、总体概率的估计;,2.假设检验:基于对总体的假设,通过样本数据推断总体参数的差异性。,2023/7
2、/8,4/110,中国人民解放军总医院 标准运行管理科,复 习,3.何时应用t 检验?,定量变量两总体均数差异性检验,随机样本,来自正态分布总体,两总体方差相等(方差齐),2023/7/8,5/110,中国人民解放军总医院 标准运行管理科,复 习,4.t 检验类型?,单样本资料的t 检验,配对设计资料的t 检验,两独立样本资料t 检验-方差齐,两独立样本资料t 检验-方差不齐,大样本资料的Z检验,2023/7/8,6/110,中国人民解放军总医院 标准运行管理科,复 习,5.资料的统计分析策略?,?资料类型:,?比较指标:,定量变量,无序分类,?设计类型:,?水平数量:,?参数分布:,均数,方
3、差,率,构成比,完全随机,配伍组,单水平,两水平,三水平,正态分布,非正态分布,有序分类,?分析方法:,t 检验,方差分析,2023/7/8,7/110,中国人民解放军总医院 标准运行管理科,复 习,2023/7/8,8/110,中国人民解放军总医院 标准运行管理科,数据资料,变量类型,数值变量,分类变量,比较参数,两个样本,2023/7/8,9/110,中国人民解放军总医院 标准运行管理科,1 样本;1总体,比较参数,样本个数,设计类型,多个个样本,配对设计,完全随机设计,2023/7/8,10/110,中国人民解放军总医院 标准运行管理科,问题 1,研究目的:评估阻塞性睡眠呼吸暂停低通气综
4、合征(OSAHS)患者的运动心肺功能变化,以期发现心血管疾病的潜在危险。,研究设计:将30例(OSAHS)患者均应用多导睡眠监测仪进行监测,根据呼吸紊乱指数(AHI)分为轻中度和重度组,单纯打鼾组患者20例。测得心肺功能指标见表。,2023/7/8,11/110,中国人民解放军总医院 标准运行管理科,问题 1,2023/7/8,12/110,中国人民解放军总医院 标准运行管理科,问题 1,结果:采用t 检验进行分析得出 OSAHS组患者FCV、FEV1、FVC%pred、FEF25、FEF50与单纯打鼾组比较差异有统计学意义(P0.05);OSAHS组患者与单纯打鼾组运动心肺功能指标比较,OS
5、AHS组在最大耗氧最大运动负荷、无氧阈(AT)及心率均低于单纯打鼾组(P0.05)。,2023/7/8,13/110,中国人民解放军总医院 标准运行管理科,问题 1,分析:本研究有一个试验因素,即阻塞性睡眠呼吸暂停,研究者设计之初分为3个水平,即轻中度和重度组,单纯打鼾组。此试验为单因素3水平设计。,存在问题:研究者误用t检验进行统计分析。t检验仅适用于单因素且水平数最多为2个的定量资料均数比较,2023/7/8,14/110,中国人民解放军总医院 标准运行管理科,问题 1,正确方法:如单因素3水平设计定量资料满足参数检验前提条件,应选用单因素3水平设计的定量资料方差分析;否则选用单因素3水平
6、设计的定量资料Kruskal-Wallis秩和检验。,2023/7/8,15/110,中国人民解放军总医院 标准运行管理科,2023/7/8,16/110,中国人民解放军总医院 标准运行管理科,问题 2,例1 为研究钙离子对体重的影响作用,某研究者将36只肥胖模型大白鼠随机分为三组,每组12只,分别给予高脂正常剂量钙(0.5%)、高脂中剂量钙(1.0%)和高脂高剂量钙(1.5%)三种不同的饲料,喂养9周,测其喂养前后体重的差值,问三组不同喂养方式下大白鼠体重改变是否剖不同?,2023/7/8,17/110,中国人民解放军总医院 标准运行管理科,问题 2,2023/7/8,18/110,中国人民
7、解放军总医院 标准运行管理科,问题 2,分析:处理因素:单因素,即饲料;水平数:3水平,即高脂正常剂量钙(0.5%)、高脂中剂量钙(1.0%)和高脂高剂量钙(1.5%)实验效应:喂养前后体重的差值设计类型:单因素3水平设计 统计方法:完全随机设计资料的方差分析,2023/7/8,19/110,中国人民解放军总医院 标准运行管理科,主要内容,ANOVA,ANALYSIS OF VARIANCE,2023/7/8,20/110,中国人民解放军总医院 标准运行管理科,1.方差分析的含义,方差是描述变异的一种指标,方差分析是一种假设检验的方法。方差分析也就是对变异的分析。是对总变异进行分析。看总变异是
8、由哪些部分组成的,这些部分间的关系如何。,2023/7/8,21/110,中国人民解放军总医院 标准运行管理科,根据变异的来源,将全部观察值总的离均差平方和及自由度分解为两个或多个部分,除随机误差外,其余每个部分的变异可由某些特定因素的作用加以解释。通过比较不同来源变异的方差(也叫均方MS),借助F分布做出统计推断,从而判断某因素对观察指标有无影响。,2023/7/8,22/110,中国人民解放军总医院 标准运行管理科,问题 2,2023/7/8,23/110,中国人民解放军总医院 标准运行管理科,1.总变异 36只大白鼠喂养9周后体重差值X大小各不相同,这种变异称为总变异(total var
9、iation)。总变异的大小用 SS总=(观测数据-总均数)2 与总均方MS 总描述。其中N为总例数,总=N-1为总自由度,2023/7/8,24/110,中国人民解放军总医院 标准运行管理科,2.组间变异 3组饲料饲养大白鼠,其体重差值的样本均数各不相同,这种变异称为组间变异(variation between groups),反映不同饲料对大白鼠体重的影响,也包含了随机误差。组间总变异的大小用 SS组间=(组均数-总均数)2 与组间均方MS 组间描述。其中k为组数,组间=k-1为组间自由度,2023/7/8,25/110,中国人民解放军总医院 标准运行管理科,3.组内变异 各组内大白鼠体重
10、差值大小各不相同,这种变异称为组内变异(variation within groups),反映随机误差。组内总变异的大小用 SS组内=(观测数据-组均数)2 与组内均方MS 组内描述。其中组内=N-k为组内自由度,2023/7/8,26/110,中国人民解放军总医院 标准运行管理科,方差分析的零假设为 H0:1=2=k,即所有总体均数相等;备择假设为H1:至少有两个总体均数不相等。如H0成立,则组间变异应与组内变异一样,只反映随机误差的作用大小。,2023/7/8,27/110,中国人民解放军总医院 标准运行管理科,主要内容,2023/7/8,28/110,中国人民解放军总医院 标准运行管理科
11、,例2 某社区随机抽取糖尿病患者、IGT异常和正常人共30人进行载蛋白测定,结果如下,问3种人的载蛋白有无差别?,2023/7/8,29/110,中国人民解放军总医院 标准运行管理科,n1=11n2=9n3=10N=30,2023/7/8,30/110,中国人民解放军总医院 标准运行管理科,所有人的载脂蛋白的变异可分解为两部分:组内变异(SSE),反映载脂蛋白测定值的随机误差和个体差异;组间变异(SSA),反映随机误差和不同的生理病理状态对载脂蛋白的影响。,2023/7/8,31/110,中国人民解放军总医院 标准运行管理科,2023/7/8,32/110,中国人民解放军总医院 标准运行管理科
12、,Xij第i 个组的第j 个观察值I=1,2,kJ=1,2,ni ni第i 个处理组的例数ni=NXi=X=,2023/7/8,33/110,中国人民解放军总医院 标准运行管理科,列举存在的变异及意义,1.全部的30个实验数据之间大小不等,存在变异(总变异)。2.各个组间存在变异(组间变异):反映处理因素之间的作用,以及随机误差。3.各个组内个体间数据不同:反映了观察值的随机误差(组内变异)。,2023/7/8,34/110,中国人民解放军总医院 标准运行管理科,各种变异的表示方法,SS总总MS总,SS组内组内MS组内,SS组间组间MS组间,三者之间的关系:SS总=SS组内+SS组间总=组内+
13、组间,2023/7/8,35/110,中国人民解放军总医院 标准运行管理科,2023/7/8,36/110,中国人民解放军总医院 标准运行管理科,计算:,2023/7/8,37/110,中国人民解放军总医院 标准运行管理科,方差分析的步骤,1.建立假设 H0:1=2=3=.H1:总体均数不全相等2.确定显著性水平,用 表示,常取0.05。3.计算统计量F4.求概率值P5.做出推论:统计学结论和专业结论。,2023/7/8,38/110,中国人民解放军总医院 标准运行管理科,F=MS组间/MS组内 公式是在H0成立的条件下进行的,即MS组间与MS组内差别应该很小,F值应该接近于1。那么要接近到什
14、么程度呢?(Fisher计算出了F的分布规律,即标准的F値)通过这个公式计算出统计量F,查表求出对应的P值,与进行比较,以确定是否为小概率事件。,计算统计量F,2023/7/8,39/110,中国人民解放军总医院 标准运行管理科,2023/7/8,中国人民解放军总医院 医疗统计科,40/110,完整书写方差检验的过程,1.建立假设 H0:3种载脂蛋白的总体均数相等 1=2=3 H1:3种载脂蛋白的总体均数不全相等2.确定显著性水平,用 表示,常取0.05。3.计算统计量F:F=MS组间/MS组内=5.854 组间=组数-1=312 组内=N-组数303274.计算概率值P:F0.05(2,27
15、)3.35 F5.854,P是F所对应的概率値。P与的大小进行比较,?5.做出推论:统计学结论?专业结论?,2023/7/8,41/110,中国人民解放军总医院 标准运行管理科,2023/7/8,中国人民解放军总医院 医疗统计科,42/110,应用条件,各样本是相互独立的随机样本各样本来自正态分布各样本方差相等,即方差齐。,2023/7/8,43/110,中国人民解放军总医院 标准运行管理科,主要内容,(Randomized block design Two-way ANOVA),2023/7/8,44/110,中国人民解放军总医院 标准运行管理科,例3 对小白鼠喂以A、B、C三种不同的营养素
16、,目的是了解不同营养素增重的效果,采用随机区组设计方法,以窝别作为划分区组的特征,以消除遗传因素对体重增长的影响。现将同品系同体重的24只小白鼠分为8个区组,每个区组3只小白鼠。三周后体重增量结果(克)如下,问小白鼠经三种不同营养素喂养后所增体重有无差别?,2023/7/8,45/110,中国人民解放军总医院 标准运行管理科,2023/7/8,46/110,中国人民解放军总医院 标准运行管理科,将全部受试对象按某种或某些特性分为若干个区组,使每个区组内的观察对象与研究对象的水平尽可能相近,减少了个体间差异对研究结果的影响,比成组设计更容易检验出处理因素间的差别,提高了研究效率。注:是配对资料的
17、扩充。,2023/7/8,47/110,中国人民解放军总医院 标准运行管理科,分析变异,1.总变异:24只小白鼠的增重不等,与均数之间存在差别。2.处理间变异:喂不同营养素的小白鼠增重不同。3.区组间变异:不同窝别的小白鼠增重不同4.误差:各组内小白鼠增重不同,2023/7/8,48/110,中国人民解放军总医院 标准运行管理科,SS总总,SS误差误差MS误差,SS处理处理MS处理,变异之间的关系:SS总=SS处理+SS区组+SS误差总=处理+区组+误差,变异间的关系,SS区组区组MS区组,2023/7/8,49/110,中国人民解放军总医院 标准运行管理科,统计量F 的计算,F1=MS处理/
18、MS误差 F2=MS区组/MS误差自由度:处理=组数-1=3-1=2 区组=区数-1=8-1=7 误差=(组数-1)(区数-1)=14,2023/7/8,50/110,中国人民解放军总医院 标准运行管理科,方差分析结果,2023/7/8,51/110,中国人民解放军总医院 标准运行管理科,2023/7/8,52/110,中国人民解放军总医院 标准运行管理科,完整书写方差分析的过程,1.建立假设:H0:3种营养素喂养的小白鼠体重增量相等 1=2=3 H1:3种营养素喂养的小白鼠体重增量不全相等2.确定显著性水平,用 表示,常取0.05。3.计算统计量F:F=MS处理/MS误差4.求概率值P:5.
19、做出推论:,2023/7/8,53/110,中国人民解放军总医院 标准运行管理科,例 某湖水不同季节的氯化物含量测定值如下,问在不同季节该湖水中氯化物含量有无差别?,区别完全随机化设计和随机区组设计,2023/7/8,54/110,中国人民解放军总医院 标准运行管理科,某湖水中不同季节氯化物含量测定值(mg/L),完全随机设计,2023/7/8,55/110,中国人民解放军总医院 标准运行管理科,某湖水中不同季节氯化物含量测定值(mg/L),随机区组设计,2023/7/8,56/110,中国人民解放军总医院 标准运行管理科,例 某医师为研究脾切除手术过程中门静脉压力kPa的变化,测得以下数据,
20、试作分析。,方法不当会影响统计结果,2023/7/8,57/110,中国人民解放军总医院 标准运行管理科,脾切除手术中不同时期的门静脉压力kPa,2023/7/8,58/110,中国人民解放军总医院 标准运行管理科,Analysis of Variance Procedure Sum of MeanSource DF Squares Square F Value Pr FGROUP 2 0.4281 0.2141 0.20 0.8198Error 21 22.4065 1.0670Corrected Total 23 22.8346,结论:,完全随机设计,随机区组设计,2023/7/8,59/
21、110,中国人民解放军总医院 标准运行管理科,存在问题,方差分析结果提供了各组均数间差别的总的信息,但尚未提供各组间差别的具体信息,即尚未指出哪几个组均数间的差别具有或不具有统计学意义。为了得到这方面的信息,可进行多个样本间的两两比较。,2023/7/8,60/110,中国人民解放军总医院 标准运行管理科,主要内容,(Multiple comparison),2023/7/8,61/110,中国人民解放军总医院 标准运行管理科,能否用t检验或检验?每次犯第一类错误的概率0.05,10次都犯的概率不是0.05,而是:?远大于0.05,不是小概率事件,会把本来无差别的两个总体均数判断为有差别。,2
22、023/7/8,62/110,中国人民解放军总医院 标准运行管理科,1多个样本均数间每两个均数的比较适用于:在研究设计阶段未预先考虑或未预料到,经数据结果的提示后,才决定的多个均数间的两两比较,常见于探索性研究。采用的检验方法称为最小显著极差法(LSR法)常用方法:(1)q检验(又称Student-Newman-Keuls法,简称SNK法)(2)新复极差检验(SSR法,Duncan法),2023/7/8,63/110,中国人民解放军总医院 标准运行管理科,检验统计量 q检验界值表,它有两个自由度,一个是=E,另一个是a,a指将方差分析中的几组样本均数按从小到大顺序排列后要比较的A、B两组所包含
23、的组数(包含A、B两组本身)。,q检验,2023/7/8,64/110,中国人民解放军总医院 标准运行管理科,H0:任2个人群的载脂蛋白的总体均数相等,即A=BH1:AB将3组样本均数从小到大(或从大到小)顺序排列,并编上组次组次 1 2 3均数 102.39 105.45 122.80组别 IGT异常 糖尿病患者 正常人,例(续例3)对三个人群的载脂蛋白作两两比较。,2023/7/8,65/110,中国人民解放军总医院 标准运行管理科,三组均数比较的q检验,从p值一栏中可以推断出结论,即IGT异常与正常人的载脂蛋白有差别,糖尿病患者与正常人的载脂蛋白有差别。,=E,2023/7/8,66/1
24、10,中国人民解放军总医院 标准运行管理科,有时并不需要将几组均数都一一作比较,而只须将对照组与几个实验组作比较。常用的方法有:最小显著差数法(LSD法),实质为两个均数比较的t检验法(查t表).,2多个实验组与一个对照组均数间的两两比较,=E,2023/7/8,67/110,中国人民解放军总医院 标准运行管理科,IGT异常与糖尿病患者的比较H0:1=2 H1:12=0.05p0.05,认为二者无差别,例(续例2),2023/7/8,68/110,中国人民解放军总医院 标准运行管理科,IGT异常与正常人的比较H0:2=3 H1:23=0.05=27 查t表 t(0.05,27)=2.052 t
25、(0.01,27)=2.771 0.002p0.005,认为二者有差别,2023/7/8,69/110,中国人民解放军总医院 标准运行管理科,当处理组k=2时,LSD法和q检验方法尺度相同;当处理组k3时,LSD法和q检验方法尺度不同;LSD法较低,而q检验方法较高.在实际工作中,要求精度高的用q检验,实验组与对照相比用LSD法.,多重比较方法的比较,2023/7/8,70/110,中国人民解放军总医院 标准运行管理科,标记字母法,多重比较的表示方法,2023/7/8,71/110,中国人民解放军总医院 标准运行管理科,梯形法,多重比较的表示方法,2023/7/8,72/110,中国人民解放军
26、总医院 标准运行管理科,小结:方差分析思路,1.方差分析用于进行多组均数之间的比较;即采用一定的方法来比较组内变异和组间变异的大小,如果后者远远大于前者,说明处理因素的影响的确存在。总变异=随机变异+处理因素导致的变异 总变异=组内变异(误差)+组间变异,2023/7/8,73/110,中国人民解放军总医院 标准运行管理科,小结:方差分析思路,2.多重比较:针对两两比较时如何控制一类错误的大小,统计学上已经发展出一系列方法。3.方差分析要求各样本来自正态总体,且各总体方差相等。如果这些条件不满足,应进行变量变换,或更改分析方法。,2023/7/8,74/110,中国人民解放军总医院 标准运行管
27、理科,求出变异平方和与自由度;列出方差分析表,进行F检验;若F检验差异显著,进行多重比较.,方差分析的基本步骤,小结:方差分析思路,2023/7/8,75/110,中国人民解放军总医院 标准运行管理科,方差分析,76,小 结,单因素方差分析的SPSS实现,2023/7/8,77/110,中国人民解放军总医院 标准运行管理科,SPSS单因素方差分析过程名,2023/7/8,78/110,中国人民解放军总医院 标准运行管理科,1.完全随机设计资料的方差分析One-Way ANOVA,例1 某高原研究组将籍贯相同、年龄相同、身高体重接近的30名新战士随机分为三组,甲组为对照组,按常规训练,乙组为锻炼
28、组,每天除常规训练外,接受中速长跑与健身操锻炼,丙组为药物组,除常规训练外,服用抗疲劳药物,一月后测定第一秒用力肺活量(L),结果见表。试比较三组第一秒用力肺活量有无差别。,2023/7/8,79/110,中国人民解放军总医院 标准运行管理科,2023/7/8,80/110,中国人民解放军总医院 标准运行管理科,n行2列(指标变量、分组变量),数据格式,2023/7/8,81/110,中国人民解放军总医院 标准运行管理科,Analyze Compare Means One-Way ANOVA,检验步骤,2023/7/8,82/110,中国人民解放军总医院 标准运行管理科,One-Way ANO
29、VA 对话框,2023/7/8,83/110,中国人民解放军总医院 标准运行管理科,Post Hoc Multiple Comparisons 对话框,2023/7/8,84/110,中国人民解放军总医院 标准运行管理科,Option对话框,2023/7/8,85/110,中国人民解放军总医院 标准运行管理科,点击“OK”,运行结果,2023/7/8,86/110,中国人民解放军总医院 标准运行管理科,结果输出,2023/7/8,87/110,中国人民解放军总医院 标准运行管理科,基本统计描述,2023/7/8,88/110,中国人民解放军总医院 标准运行管理科,方差齐性检验,2023/7/8
30、,89/110,中国人民解放军总医院 标准运行管理科,方差分析表,2023/7/8,90/110,中国人民解放军总医院 标准运行管理科,多重比较(LSD法),2023/7/8,91/110,中国人民解放军总医院 标准运行管理科,多重比较(SNK法),2023/7/8,92/110,中国人民解放军总医院 标准运行管理科,2.随机区组(或单位组、配伍组)设计的方差分析,例2 下表是11名战士在不同海拔高度的血氨值。试 分析,2023/7/8,93/110,中国人民解放军总医院 标准运行管理科,1行3列(指标变量、处理组分组变量、单位组分组变量),数据格式,2023/7/8,94/110,中国人民解
31、放军总医院 标准运行管理科,Analyze General Linear Models(广义线性模型)Univariate(单变量),检验步骤,2023/7/8,95/110,中国人民解放军总医院 标准运行管理科,Univariate对话框,多重比较,2023/7/8,96/110,中国人民解放军总医院 标准运行管理科,Univariate:Model 对话框,中国人民解放军总医院 标准运行管理科,Univariate:Model 对话框,2023/7/8,98/110,中国人民解放军总医院 标准运行管理科,Post Hoc Multiple Comperisons for Observed
32、Means对话框,2023/7/8,99/110,中国人民解放军总医院 标准运行管理科,100,Options对话框,点击“OK”,运行结果,2023/7/8,101/110,结果输出,2023/7/8,中国人民解放军总医院 医疗统计科,102/110,有效数据例数统计,2023/7/8,103/110,中国人民解放军总医院 标准运行管理科,分组统计描述(均数、标准差),2023/7/8,104/110,中国人民解放军总医院 标准运行管理科,方差分析表,2023/7/8,105/110,中国人民解放军总医院 标准运行管理科,均数估计,2023/7/8,106/110,中国人民解放军总医院 标准
33、运行管理科,2007.01,107,多重比较,2023/7/8,108/110,中国人民解放军总医院 标准运行管理科,问题 2,2023/7/8,109/110,研究目的:在呼吸机所致肺损伤(VILI)的炎症反应中加用呼气末正压(PEEP)对核因子-k的活性变化的影响。,研究设计:在将健康成年新西兰白兔30只随机分为3组:PEEP 组-致伤通气+4 cmH2OZEEP 组-致伤通气+0 cmH2O对照组 始终以正常条件通气,机械通气开始后4小时处死动物。测肺组织中NB-k的含量。,中国人民解放军总医院 标准运行管理科,问题 2,2023/7/8,110/110,分析:貌似三个实验组,即PEEP,ZEEP、正常通气,是单因素三水平设计。,实际:作者相比较大潮气量通气与正常通气中NB-k的含量,以及加用PEEP对NB-k含量的影响。,真相:本实验涉及两个实验因素,一个因素是“是否致伤通气”,其有两个水平:是、否;另一个因素是“使用PEEP的水平”,其有两个水平:0 cmH2O、4 cmH2O。两因素量水平设计。,中国人民解放军总医院 标准运行管理科,问题 2,2023/7/8,111/110,中国人民解放军总医院 标准运行管理科,2023/7/8,112/110,谢谢!,中国人民解放军总医院 标准运行管理科,
链接地址:https://www.31ppt.com/p-5453147.html