《方差分析 》PPT课件.ppt
第六章 方差分析,方差分析简介 单因素方差分析 多因素方差分析,一、方差分析简介,方差分析(analysis of variance,简记为ANOVA),又称变异数分析或F检验,主要用来分析某一个或几个因素对指标是否有显著影响。方差分析中要研究的因素通常是分类型的自变量,指标则是数值型的因变量。对于每一个分类型自变量,按照分类都拥有不同的水平(代表不同的总体),通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量有无显著的影响。在方差分析中,我们通常把试验数据的总离差(或总方差)分解为各因素的离差和误差的离差,然后利用这些离差来构造检验统计量从而实现上述的检验。按照所研究的因素个数的不同,可以将方差分析分为单因素方差分析和多因素方差分析。,1、基本概念,一、方差分析简介,对数据进行方差分析要建立在一定的假设基础之上,如果不满足这些假设,得出的结论就会出错。一般来说,方差分析有以下两个假设条件:(1)正态性:每个总体均独立地服从于正态分布,即对每一个水平,观测数据是来正态分布的随机样本。(2)方差齐性:各总体的方差相同。,2、基本假设,二、单因素方差分析,1、单因素方差分析模型,二、单因素方差分析,1、单因素方差分析模型,二、单因素方差分析,1、单因素方差分析模型,二、单因素方差分析,1、单因素方差分析模型,通常我们把主要的计算结果列为表格形式,称为方差分析表。,二、单因素方差分析,2、多重比较,在方差分析中,如果经过F检验后拒绝原假设,即认为因素A的各水平存在显著差异,但并不一定两两之间都有差异。这时,我们还需要去确认哪些水平间是有差异的,这就要进行多重比较。多重比较即比较任意两个水平间的均值是否存在显著差异,最常用的方法是两两之间进行配对t检验。多重比较的检验方法还有很多,其他一些较为常用的方法有:Bonferroni的t检验法,Duncan的多重极差检验法,Tukey的学生化极差检验法等。,在SAS系统中,方差分析一般通过ANOVA过程来实现。ANOVA过程用于实现单因素方差分析的语句格式如下:,PROC ANOVA DATA=数据集名;CLASS 因素变量名;MODEL 指标变量名=因素变量名;MEANS 因素变量名;RUN;,其中,PROC语句、CLASS语句和MODEL语句是必须的,而且CLASS语句必须在MODEL语句之前。,3、ANOVA过程,二、单因素方差分析,语句说明:(1)PROC语句规定开始运行ANOVA过程,并指定要分析的数据集名。(2)在ANOVA过程中要使用的因素变量必须首先在CLASS语句中声明,变量可以是数值型,也可以是字符型。(3)MODEL语句用来规定指标变量和因素变量。(4)MEANS语句用来计算因素各水平下指标变量的均值、标准差等,并进行多重比较。,3、ANOVA过程,二、单因素方差分析,三、多因素方差分析,1、多因素方差分析模型,多因素方差分析研究两个或两个以上因素对指标的影响。这里,我们主要介绍两因素方差分析。在两因素方差分析的模型中,因素增加到了两个,指标仍然只有一个,这时因素对指标的影响就有两种形式:(1)只考虑因素A和B各自对指标的影响;(2)不仅研究因素A和B各自对指标的影响,还要考虑A和B的交互效应对指标的影响。,三、多因素方差分析,1、多因素方差分析模型,无交互效应的两因素方差分析表,三、多因素方差分析,1、多因素方差分析模型,有交互效应的两因素方差分析表,多因素方差分析同样可以通过ANOVA过程来实现,语句格式如下:,PROC ANOVA DATA=数据集名;MEANS 因素效应列表;RUN;,其中,因素效应可以是每个因素的主效应,也可以是多个因素的交互效应。上述语句与实现单因素方差分析的语句是类似的,只是因素的个数增加了。,2、ANOVA过程,三、多因素方差分析,GLM过程用来分析符合一般线性模型的数据,它可以用在许多不同的分析中,如线性回归、多项式回归、方差分析、协方差分析、偏相关分析等。GLM过程用来实现方差分析的语句如下:,PROC GLM DATA=数据集名;MEANS 因素效应列表;RUN;,用在方差分析时,GLM过程和ANOVA过程的语句几乎一样,选项也基本相同。但是对非均衡的数据,GLM过程要比ANOVA过更有效。,3、GLM过程,三、多因素方差分析,