第5章 SPSS的方差分析 SPSS19.0软件使用教程.ppt
《第5章 SPSS的方差分析 SPSS19.0软件使用教程.ppt》由会员分享,可在线阅读,更多相关《第5章 SPSS的方差分析 SPSS19.0软件使用教程.ppt(93页珍藏版)》请在三一办公上搜索。
1、,第5章 SPSS的方差分析,5.1 方差分述析概,在第4章中我们讨论了如何对一个总体及两个总体的均值进行检验,如我们要确定两种销售方式的效果是否相同,可以对零假设进行检验。但有时销售方式有很多种,这就是多个总体均值是否相等的假设检验问题了,所采用的方法是方差分析。,5.1.1 方差分析的概念,表5-1 某公司产品销售方式所对应的销售量,方差分析中有以下几个重要概念。(1)因素(Factor):是指所要研究的变量,它可能对因变量产生影响。如果方差分析只针对一个因素进行,称为单因素方差分析。如果同时针对多个因素进行,称为多因素方差分析。(2)水平(Level):水平指因素的具体表现,如销售的四种
2、方式就是因素的不同取值等级。(3)单元(Cell):指因素水平之间的组合。(4)元素(Element):指用于测量因变量的最小单位。一个单元里可以只有一个元素,也可以有多个元素。(5)交互作用(Interaction):如果一个因素的效应大小在另一个因素不同水平下明显不同,则称两因素间存在交互作用。,5.1.2 方差分析的基本思想,在表5-1中,要研究不同推销方式的效果,其实就归结为一个检验问题,设为第i(i=1,2,3,4)种推销方式的平均销售量,即检验原假设是否为真。从数值上观察,四个均值都不相等,方式二的销售量明显较大。从表5-1可以看到,20个数据各不相同,这种差异可能是由以下两方面的
3、原因引起的。一是推销方式的影响,不同的方式会使人们产生不同消费冲动和购买欲望,从而产生不同的购买行动。这种由不同水平造成的差异,称之为系统性差异。,二是随机因素的影响。同一种推销方式在不同的工作日销量也会不同,因为来商店的人群数量不一,经济收入不一,当班服务员态度不一,这种由随机因素造成的差异,我们称之为随机性差异。两个方面产生的差异用两个方差来计量:一是变量之间的总体差异,即水平之间的方差。二是水平内部的方差。前者既包括系统性差异,也包括随机性差异;后者仅包括随机性差异。,5.1.3 方差分析的基本假设,(1)各样本的独立性。即各组观察数据,是从相互独立的总体中抽取的。(2)要求所有观察值都
4、是从正态总体中抽取,且方差相等。在实际应用中能够严格满足这些假定条件的客观现象是很少的,在社会经济现象中更是如此。但一般应近似地符合上述要求。水平之间的方差(也称为组间方差)与水平内部的方差(也称组内方差)之间的比值是一个服从F分布的统计量 F=水平间方差/水平内方差=组间方差/组内方差,5.2 SPSS在单因素方差分析中的应用,单因素方差分析也叫一维方差分析,它用来研究一个因素的不同水平是否对观测变量产生了显著影响,即检验由单一因素影响的一个(或几个相互独立的)因变量由因素各水平分组的均值之间的差异是否具有统计意义。1.使用条件应用方差分析时,数据应当满足以下几个条件:在各个水平之下观察对象
5、是独立随机抽样,即独立性;各个水平的因变量服从正态分布,即正态性;各个水平下的总体具有相同的方差,即方差齐;,2.基本原理 方差分析认为:SST(总的离差平方和)=SSA(组间离差平方和)+SSE(组内离差平方和)如果在总的离差平方和中,组间离差平方和所占比例较大,说明观测变量的变动主要是由因素的不同水平引起的,可以主要由因素的变动来解释,系统性差异给观测变量带来了显著影响;反之,如果组间离差平方和所占比例很小,说明观测变量的变动主要由随机变量因素引起的。,SPSS将自动计算检验统计量和相伴概率P值,若P值小于等于显著性水平,则拒绝原假设,认为因素的不同水平对观测变量产生显著影响;反之,接受零
6、假设,认为因素的不同水平没有对观测变量产生显著影响。3.多重比较检验问题多重比较是通过对总体均值之间的配对比较来进一步检验到底哪些均值之间存在差异。,4.各组均值的精细比较多重比较检验只能分析两两均值之间的差异性,但是有些时候需要比较多个均值之间的差异性。具体操作是将其转化为研究这两组总的均值是否存在显著差异,即与是否有显著差异。这种比较是对各均值的某一线性组合结构进行判断,即上述检验可以等价改写为对进行统计推断。这种事先指定均值的线性组合,再对该线性组合进行检验的分析方法就是各组均值的精细比较。显然,可以根据实际问题,提出若干种检验问题。,5.2.2 单因素方差分析的SPSS操作详解,Ste
7、p01:打开主操作窗口选择菜单栏中的【Analyze(分析)】【Compare Means(比较均值)】【One-Way ANOVA(单因素ANOVA)】命令,弹出【One-Way ANOVA(单因素ANOVA)】对话框,这是单因素方差分析的主操作窗口。Step02:选择因变量在【One-Way ANOVA(单因素ANOVA)】对话框的候选变量列表框中选择一个或几个变量,将其添加至【Dependent List(因变量列表)】列表框中,选择的变量就是要进行方差分析的观测变量(因变量)。,Step03:选择因素变量在【One-Way ANOVA(单因素ANOVA)】对话框的候选变量列表框中选择一
8、个变量,将其添加至【Factor(因子)】列表框中,选择的变量就是要进行方差分析的因素变量。Step04:均值精细比较单击【Contrasts】按钮,弹出如右图所示的【Contrasts(对比)】对话框。,Step05:均值多重比较单击【Post Hoc】按钮,弹出如下图所示的【Post Hoc Multiple Comparisons(两两比较)】对话框,该对话框用于设置均值的多重比较检验。,(1)方差齐性(Equal Variances Assumed)时,有如下方法供选择。LSD(Least-significant difference):最小显著差数法,用t检验完成各组均值间的配对比较
9、。Bonferroni(LSDMOD):用t检验完成各组间均值的配对比较,但通过设置每个检验的误差率来控制整个误差率。Sidak:计算t统计量进行多重配对比较。可以调整显著性水平,比Bofferroni方法的界限要小。Scheffe:用F分布对所有可能的组合进行同时进入的配对比较。此法可用于检查组均值的所有线性组合,但不是公正的配对比较。R-E-G-W F:基于F检验的Ryan-Einot-Gabriel-Welsch多重比较检验。,R-E-G-W Q:基于Student Range分布的Ryan-Einot-Gabriel-Welsch range test多重配对比较。S-N-K:用Stu
10、dent Range分布进行所有各组均值间的配对比较。Tukey:用Student-Range统计量进行所有组间均值的配对比较,用所有配对比较误差率作为实验误差率。Tukeys-b:用stndent Range分布进行组间均值的配对比较,其精确值为前两种检验相应值的平均值。Duncan:指定一系列的Range值,逐步进行计算比较得出结论。Hochbergs GT2:用正态最大系数进行多重比较。Gabriel:用正态标准系数进行配对比较,在单元数较大时,这种方法较自由。,Waller-Dunca:用t统计量进行多重比较检验,使用贝叶斯逼近的多重比较检验法。Dunnett:多重配对比较的t检验法,
11、用于一组处理对一个控制类均值的比较。默认的控制类是最后一组。(2)方差不具有齐性(Equal Varance not assumed)时,有如下方法供选择。Tamhanes T2:基于t检验进行配对比较。Dunnetts T3:基于Student最大模的成对比较法。Games-Howell:Games-Howell比较,该方法较灵活。Dunnetts C:基于Student极值的成对比较法。(3)Significance:确定各种检验的显著性水平,系统默认值为 0.05,可由用户重新设定。,Step06:其他选项输出单击【Options】按钮,在弹出的对话框中进行如下设置。,(1)【Stati
12、stics(统计量)】复选框:选择输出统计量。Descriptive:要求输出描述统计量。选择此项输出观测值容量、均值、标准差、标准误、最小值、最大值、各组中每个因变量的95置信区间。Fixed and random effects:显示固定和随机描述统计量。Homogeneity-of-variance:计算Levene统计量进行方差齐性检验。Brown-Forsythe:计算检验组均值相等假设的布朗检验。在方差齐性假设不成立时,这个统计量比F统计量更优越。Welch:计算检验组均值相等假设的Welch统计量,在不具备方差齐性假设时,也是一个比F统计量更优越的统计量。,(2)Means pl
13、ot:均值折线图。根据各组均值变化描绘出因变量的分布情况。(3)【Missing Values(缺失值)】选项组中提供了缺失值处理方法,该选项和均值比较过程中的缺失值选项意义相同。Step07:相关统计量的Bootstrap估计。单击【Bootstrap】按钮,弹出如右图所示的对话框。描述统计表支持均值和标准差的bootstrap 估计。多重比较表支持平均值差值的bootstrap 估计。对比检验表支持对比值的bootstrap 估计和显著性检验。,5.2.3 实例图文分析:信息来源与传播,1.实例内容 某机构的各个级别的管理人员需要足够的信息来完成各自的任务。最近,一项研究调查了信息来源对信
14、息传播的影响。在这项特定的研究中,信息来源是上级、同级和下级。在每种情况下,对信息传播进行测度:数值越高,说明信息传播越广。检验信息来源是否对信息传播有显著影响?你的结论是什么?2.实例操作,由于不同的信息来源可能导致信息传播测度不同。本案例中,信息来源是因素,“上级、同级和下级”是因素的三种不同水平,信息传播测度是因变量(观测变量)。由于这里有三个水平,因此不能采用两样本的均值检验过程,故考虑采用单因素方差分析法。进行如下假设检验:H0:三种不同信息来源对信息传播测度平均值没有显著性影响;H1:三种不同信息来源对信息传播测度平均值存在显著性影响。,Step01:打开对话框打开数据文件5-1.
15、sav,选择菜单栏中的【Analyze(分析)】【Compare Means(比较均值)】【One-Way ANOVA(单因素ANOVA)】命令,弹出【One-Way ANOVA(单因素ANOVA)】对话框。提示:在使用前,请注意数据是否符合方差分析的前提条件。,Step02:选择因变量在候选变量列表框中选择“scale”变量作为因变量,将其添加至【Dependent List(因变量列表)】列表框中。,Step03:选择因素变量在候选变量列表框中选择“source”变量作为水平值,将其添加至【Factor(因子)】列表框中。,Step04:选择均值多重比较方法单击【Options】按钮,在弹
16、出的对话框中勾选【Homogeneity-of-variance】复选框,表示输出方差齐性检验表。再单击【Continue】按钮返回主对话框。提示:根据数据特点及您的实验要求,选择不同的均值多重比较方法。,Step05:完成操作最后,单击【OK(确定)】按钮,操作完成。,3.实例结果及分析,(1)方差齐性检验 SPSS的结果报告中首先列出了方差分析检验结果。由于这里采用的是Levene检验法,故表格首先显示Levene统计量等于0.055。由于概率P值0.946明显大于显著性水平,故认为这三组数据的方差是相同的,满足方差分析的前提条件。(2)单因素方差分析表,5.2.4 实例进阶分析:股票基金
17、的费用比率,1.实例内容 Money杂志报告了股票和债券基金的收益和费用比率。10种中等规模的资本股票基金、10种小额资本股票基金、10种混合型股票基金和10种专项股票基金的费用比率的数据见表5-5所示(单位:)。(1)请检验这4种类型股票基金之间的平均费用比率的差异性。(2)混合型股票基金的费用比率是其他三种类型基金费用比率的平均水平吗?,2.实例操作,Step01:打开或建立数据文件5-2.sav,选择菜单栏中的【Analyze(分析)】【Compare Means(比较均值)】【One-Way ANOVA(单因素ANOVA)】命令,弹出【One-Way ANOVA(单因素ANOVA)】对
18、话框。这里“rate”变量表示基金的费用比率;“fund”变量表示基金的类型,其中,“1”表示中等规模的资本股票基金,“2”表示小额资本股票基金,“3”表示混合型股票基金,“4”表示专项股票基金。,Step02:在【候选变量】列表框中选择“rate”变量作为因变量,将其添加至【Dependent List(因变量列表)】列表框中。Step03:在【候选变量】列表框中选择“fund”变量作为水平值,将其添加至【Factor(因子)】列表框中。,Step04:单击【Contrasts】按钮,弹出【One-Way ANOVA:Contrasts(单因素ANOVA:对比)】对话框。勾选【Polynom
19、ial(多项式)】复选框,激活【Degree(度)】下拉菜单,默认选择【Linear(线性)】选项,表示要进行均值的精细比较。接着在【Coefficients(系数)】文本框中依次输入线性多项式的系数“1”、“1”、“3”和“1”,并单击【Add(添加)】按钮确认设置。再单击【Continue】按钮,返回主对话框。,Step05:单击【Post Hoc】按钮,弹出【Post Hoc(两两比较)】对话框。由于这里已计划好对这4组均值进行两两比较,则在其对话框中勾选【LSD】复选框。单击【Continue】按钮,返回主对话框。Step06:单击【Options】按钮,在弹出的对话框中勾选【Desc
20、riptive(描述性)】复选框表示输出描述性统计量;勾选【Homogeneity-of-variance(方差同质性)】复选框表示输出方差齐性检验表;勾选【Mean plot(均值图)】复选框表示输出各水平的均值折线图。再单击【Continue】按钮,返回主对话框。Step07:单击【One-Way ANOVA(单因素ANOVA)】对话框中的【OK】按钮,完成操作。,3.实例结果及分析,(1)描述性统计量表SPSS的结果报告中首先输出了描述性统计量,如表5-6所示。首先,中等规模的资本股票基金的平均费用比率(1.440)最低,而专项股票基金的平均费用比率(2.000)最高,但各类型基金的平均
21、值差距不大。其次,从标准差大小来看,中等规模的资本股票基金(0.3806)最低,而混合型股票基金(0.7379)最高。最后,表5-6还列出了各种类型基金的最大值、最小值及95水平的置信区间。,(2)方差齐性检验 表5-7是方差齐性检验结果表。表中显示Levene统计量等于2.086。由于概率P值0.119大于显著性水平0.05,故认为这四种类型基金费用比率的方差是相同的,满足方差分析的前提条件。,(3)单因素方差分析表 表5-7为单因素方差分析表。可以看到,费用比率总的离差平方总和为13.320;不同基金的组间离差为1.772;组内离差为11.548;它们的方差比分别为0.591和0.321,
22、相除得F统计量的观测值为1.841,对应的概率P值为0.157。这里显著性水平为0.05,由于P值大于显著性水平0.05,所以接受零假设,认为不同类型基金的费用比率没有显著性差异。,(4)多重比较检验结果 表5-8显示了两两基金之间费用比率均值比较结果。表中的星号表示在显著性水平0.05的条件下,相应的两组均值存在显著性差异。表中第四列Mean Difference表示两两不同基金费用比率差值的均值。第六列是进行t检验的概率P值,可以通过比较P值大小来判断两两基金之间的费用比率是否有显著差异。从结果来看,只有第一种和第四种基金费用比率的概率P值(0.033)小于显著性水平。因此这四种基金中,只
23、有它们之间的费用比率存在显著性差异,其他基金的费用比率之间都没有显著差异。,(5)方差分析的精细比较 案例中第二问要比较第三类基金的费用比率和其他基金之间的关系,其实就是要进行均值之间的多项式比较。表5-9首先列出了均值线性组合的系数,其实就是软件操作中第四步输入的数值。接着表5-10列出了多项式比较结果。SPSS分别给出了方差齐性和方差不齐性的检验统计量和概率P值。本案例中不管方差齐性还是不齐性,其概率P值都显著大于0.05,这说明了零假设成立,即混合型股票基金的费用比率是其他三种类型基金费用比率的平均水平。,(6)均值折线图图5-11显示了这四类基金费用比率的均值折线图。从图中明显看到,第
24、四类基金的费用比率均值明显高于其他类型的基金。,5.3 SPSS在多因素方差分析中的应用,5.3.1 多因素方差分析的基本原理 1.方法概述多因素方差分析是对一个独立变量是否受一个或多个因素或变量影响而进行的方差分析。它不仅能够分析多个因素对观测变量的独立影响,更能够分析多个因素的交互作用能否对观测变量产生显著影响。例如,对稻谷产量进行分析时,不仅单纯考虑耕地深度和施肥量都会影响产量,但同时深耕和适当的施肥可能使产量成倍增加,这时,耕地深度和施肥量就可能存在交互作用。,2.基本原理由于多因素方差分析中观察变量不仅要受到多个因素独立作用的影响,而且因素其交互作用和一些随机因素都会对变量产生影响。
25、因此观测变量值的波动要受到多个控制变量独立作用、控制变量交互作用及随机因素等三方面的影响。以两个因素为例,可以表示为:其中,Q表示各部分对应的离差平方和。多因素方差分析比较 占 的比例,以此推断不同因素以及因素之间的交互作用是否给观测变量带来显著影响。,3.软件使用方法多因素方差分析仍然采用F检验,其零假设是H0:各因素不同水平下观测变量的均值无显著差异。SPSS将自动计算F值,并依据F分布表给出相应的概率P值。我们可以根据相伴概率P值和显著性水平的大小关系来判断各因素的不同水平对观测变量是否产生了显著性影响。,5.3.2 多因素方差分析的SPSS操作详解,Step01:打开主对话框选择菜单栏
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第5章 SPSS的方差分析 SPSS19.0软件使用教程 SPSS 方差分析 SPSS19 软件 使用 教程
链接地址:https://www.31ppt.com/p-2231811.html