第七章方差分析法.ppt
《第七章方差分析法.ppt》由会员分享,可在线阅读,更多相关《第七章方差分析法.ppt(83页珍藏版)》请在三一办公上搜索。
1、2023/3/4,版权所有 BY 统计学课程组,1,第七章,方差分析Analysis of Variance(ANOVA),2023/3/4,版权所有 BY 统计学课程组,2,学习目标,掌握方差分析中的基本概念;掌握方差分析的基本思想和原理;掌握单因素方差分析的方法及应用;初步了解多重比较方法的应用;了解双因素方差分析的方法及应用。,2023/3/4,版权所有 BY 统计学课程组,3,学习内容,第一节 方差分析简介常用术语 基本假定第二节 单因素方差分析 分析模型 基本思想 分析步骤 多重比较第三节 双因素方差分析无交互作用双因素方差分析有交互作用双因素方差分析,2023/3/4,版权所有 B
2、Y 统计学课程组,4,7.1 方差分析简介,7.1.1 方差分析中的基本概念7.1.2 方差分析中的基本假设与检验,2023/3/4,版权所有 BY 统计学课程组,5,失业保险案例:为什么要进行方差分析?,为了减小失业保险支出、促进就业,政府试图为失业者提供再就业奖励:如果失业者可以在限定的时间内重新就业,他将可以获得一定数额的奖金。政策会有效吗?,2023/3/4,版权所有 BY 统计学课程组,6,试验数据,2023/3/4,版权所有 BY 统计学课程组,7,要研究的问题,总体1,1(奖金=1),总体2,2(奖金=2),总体3,3(奖金=3),总体4,4(奖金=4),2023/3/4,版权所
3、有 BY 统计学课程组,8,各个总体的均值相等吗?,2023/3/4,版权所有 BY 统计学课程组,9,失业保险案例:实验结果,1=无奖金 2=低奖金 3=中奖金 4=高奖金。根据实验结果,可以认为各总体的平均失业时间相同吗?,2023/3/4,版权所有 BY 统计学课程组,10,研究方法:两样本的t检验?,如果采用t检验法对多个总体均值进行差异显著性检验,会出现如下问题:全部检验过程烦琐,做法不经济 无统一的总体方差估计,检验的精度降低犯第一类错误的概率增大,检验的可靠性降低,2023/3/4,版权所有 BY 统计学课程组,11,方差分析可以用来比较多个均值,方差分析(Analysis of
4、 variance,ANOVA)的主要目的是通过对方差的比较来同时检验多个均值之间差异的显著性。可以看作t检验的扩展,只比较两个均值时与t检验等价。20世纪20年代由英国统计学家费喧(R.A.Fisher)最早提出的,开始应用于生物和农业田间试验,以后在许多学科中得到了广泛应用。,2023/3/4,版权所有 BY 统计学课程组,12,ANOVA(analysis of variance),由于方差分析法是通过比较有关方差的大小而得到结论的,所以在统计中,常常把运用方差分析法的活动称为方差分析。方差分析的内容很广泛,既涉及到实验设计的模式,又关乎数据分析模型中因素效应的性质。本章在完全随机试验设
5、计下,讨论固定效应模型方差分析的基本原理与方法,重点介绍单因素方差分析及两因素方差分析的内容。,2023/3/4,版权所有 BY 统计学课程组,13,7.1.1 方差分析中的几个基本概念,因变量:我们实际测量的、作为结果的变量,例如失业持续时间。因变量也称试验指标,其不同的取值常称为观察值或试验数据。自变量:作为原因的、把观测结果分成几个组以进行比较的变量例如奖金水平。在方差分析中,自变量也被称为因素(factor)。因素的不同表现,即每个自变量的不同取值称为因素的水平。,2023/3/4,版权所有 BY 统计学课程组,14,7.1.1 方差分析中的几个基本概念,方差分析主要用来研究一个定量因
6、变量与一个或多个定性自变量的关系只有一个自变量的方差分析称为单因素方差分析。研究多个因素对因变量的影响的方差分析称为多因素方差分析,其中最简单的情况是双因素方差分析。,2023/3/4,版权所有 BY 统计学课程组,15,为便于理解,在单因素方差分析中,将因 素 的任何一个水平(处理)看作是一个总体,该水平(处理)下试验 得到的数据可看成是从总体 中抽出的 一个样本,处理的重复数即为样本容量。,7.1.1:固定效应与随机效应模型,2023/3/4,版权所有 BY 统计学课程组,16,若因素 的每一个水平(处理)均做试验,相当于对该因素进行了全面调查。此种情形下,方差分析目的在于:对 比较寻优,
7、即确定因素 的显著影响水平,且该显著影响水平仅在 中有效,在 外无效,一句话,试验数据不能对因素做推断,这属于固定效应模型方差分析范畴。固定效应模型:因素的所有水平都是由实验者审慎安排而不是随机选择的。,7.1.1:固定效应模型,2023/3/4,版权所有 BY 统计学课程组,17,若只对因素 的部分水平(处理)做试验,相当于对 进行了抽样调查,此种情形下,方差分析目的在于:对因素 的总体变量所服从的分布 进行差异性检验和参数估计,即样本推断总体,这属于随机效应模型方差分析范畴。随机效应模型:因素的水平是从多个可能的水平中随机选择的。固定效应和随机效应模型在假设的设置和参数估计上有所差异,本章
8、研究的都是固定效应模型。,7.1.1:随机效应模型,2023/3/4,版权所有 BY 统计学课程组,18,方差分析与回归分析的联系*,回归分析主要用来研究定量自变量和定量因变量之间的关系(第八章学习)。回归分析中方差分析常常用来检验回归方程的整体显著性。回归模型中也可以包含定性自变量。这时回归模型与方差分析模型是等价的。,2023/3/4,版权所有 BY 统计学课程组,19,7.1.2:方差分析中的基本假设,(1)在各个总体中因变量都服从正态分布;(2)在各个总体中因变量的方差都相等;(3)各个观测值之间是相互独立的。,2023/3/4,版权所有 BY 统计学课程组,20,(1)正态性的检验,
9、各组数据的直方图Q-Q图,K-S检验*,2023/3/4,版权所有 BY 统计学课程组,21,(2)等方差性的检验,经验方法:计算各组数据的标准差,如果最大值与最小值的比例小于2:1,则可认为是同方差的。本例中,最大值和最小值的比例等于1.832。Levene检验*,2023/3/4,版权所有 BY 统计学课程组,22,方差分析对前两个假设条件是稳健的,允许一定程度的偏离。独立性的假设条件一般可以通过对数据搜集过程的控制来保证。如果确实严重偏离了前两个假设条件,则需要先对数据进行数学变换,也可以使用非参数的方法来比较各组的均值。,(3)其它说明,2023/3/4,版权所有 BY 统计学课程组,
10、23,7.2.1 单因素方差分析模型7.2.2 方差分析的基本原理7.2.3 单因素方差分析的步骤7.2.4 方差分析中的多重比较,7.2.单因素方差分析,2023/3/4,版权所有 BY 统计学课程组,24,7.2.1 单因素方差分析模型,2023/3/4,版权所有 BY 统计学课程组,25,单因素方差分析的数据结构,2023/3/4,版权所有 BY 统计学课程组,26,同一试验条件下的数据变异-随机因素影响不同试验条件下,试验数据变异-随机因素和可能存在的系统性因素即试验因素共同影响,试验数据变异原因(误差来源)分析,2023/3/4,版权所有 BY 统计学课程组,27,实验数据误差类型,
11、随机误差因素的同一水平(总体)下,样本各观察值之间的差异比如,同一奖金水平下不同不同人的失业时间是不同的这种差异可以看成是随机因素影响的结果,称为随机误差 系统误差因素的不同水平(不同总体)下,各观察值之间的差异比如,不同奖金水平之间的失业时间之间的差异这种差异可能是由于抽样的随机性所造成的,也可能是由于奖金本身所造成的,后者所形成的误差是由系统性因素造成的,称为系统误差,2023/3/4,版权所有 BY 统计学课程组,28,方差分析的实质与分析目的,方差分析的实质:观测值变异原因的数量分析。方差分析的目的:系统中是否存在显著性影响因素,2023/3/4,版权所有 BY 统计学课程组,29,7
12、.2.1 单因素方差分析模型(1),单因素方差分析:模型中有一个自变量(因素)和一个因变量。在失业保险实验中,假设张三在高奖金组,则张三的失业时间=高奖金组的平均失业时间+随机因素带来的影响=总平均失业时间+高奖金组平均值与总平均值之差+随机因素带来的影响,2023/3/4,版权所有 BY 统计学课程组,30,7.2.1 单因素方差分析模型(2),2023/3/4,版权所有 BY 统计学课程组,31,7.2.2 方差分析的基本原理,2023/3/4,版权所有 BY 统计学课程组,32,总变差(离差平方和)的分解,数据的误差用离差平方和(sum of squares)描述。组内离差平方和(wit
13、hin groups)因素的同一水平(同一个总体)下样本数据的变异比如,同一奖金水平下失业时间的差异组内离差平方和只包含随机误差组间离差平方和(between groups)因素的不同水平(不同总体)下各样本之间的变异比如,四个奖金水平之间失业时间的差异组间离差平方和既包括随机误差,也包括系统误差,2023/3/4,版权所有 BY 统计学课程组,33,总变差(离差平方和)分解的图示,组间变异,总变异,组内变异,2023/3/4,版权所有 BY 统计学课程组,34,2023/3/4,版权所有 BY 统计学课程组,35,2023/3/4,版权所有 BY 统计学课程组,36,离差平方和的自由度与均方
14、,三个平方和的自由度分别是SST 的自由度为nk-1,nk为全部观察值的个数SSA的自由度为k-1,其中k为因素水平的个数SSE 的自由度为nk-k各离差平方和的大小与观察值的多少有关,为了消除观察值多少对离差平方和大小的影响,需要将其平均,这就是均方,也称为方差。均方的计算方法是用离差平方和除以相应的自由度。,2023/3/4,版权所有 BY 统计学课程组,37,2023/3/4,版权所有 BY 统计学课程组,38,F比值,如果因素A的不同水平对结果没有影响,那么在组间方差中只包含有随机误差,两个方差的比值会接近1如果不同水平对结果有影响,组间方差就会大于组内方差,组间方差与组内方差的比值就
15、会大于1当这个比值大到某种程度时,就可以说不同水平之间存在显著差异,或者说因素A对结果有显著影响。,2023/3/4,版权所有 BY 统计学课程组,39,F比的分布,F 分布曲线,2023/3/4,版权所有 BY 统计学课程组,40,F分布与拒绝域,2023/3/4,版权所有 BY 统计学课程组,41,7.2.2:方差分析的基本思想,将k个水平(处理)的观测值作为一个整体看待,利用方差的可分解性,把观测值总变异的离差平方和及自由度分解为相应于不同变异来源的离差平方和及自由度,进而获得不同变异来源总体方差估计值;通过计算这些总体方差估计值的适当比值,即F比值,并以此比值的大小来判断各样本所属总体
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第七 方差分析
链接地址:https://www.31ppt.com/p-2934848.html