统计应用Ⅲ:方差分析.ppt
第 10 讲 统计应用:方差分析,11.1 方差分析的基本原理11.2 方差分析应用,11.1.方差分析的基本原理,一、什么是方差分析,1、方差分析(ANOVA)的定义,是通过样本,来检验多个总体均值是否相等的统计方法。,ANOVA分析的本质仍然是假设检验H0:m1=m2=mk H1:m1,m2,mk 不全相等,可看出,ANOVA比假设检验的功能更强大,应用更广泛!,2、方差分析应用广泛,H0:m零售=m旅游=m航空=m家电 H1:m零售、m旅游、m航空、m家电不全相等,3、方差分析的两个核心概念,因子:是指影响函数值的主要自变量(本例因子为行业)。水平:是指因子这种分类变量的不同取值(零售业等四类)观测值:各种水平下所得到的样本观察值。,本例的因子有几个?属于单因子还是双因子分析?,单因素方差分析的数据结构,提问:因子、水平和观测值分别是什么?,双因素方差分析的数据结构,双因子方差分析:研究两个因子作为自变量对因变量影响效应的统计分析。同单因子一样,两因子都是分类变量。,双因素方差分析数据结构,哪个是行的均值、列的均值、所有观测值的均值?,第 i 行的均值,第 j 列的均值,小结:方差分析的核心,进行假设检验H0:m1=m2=mk 含义:自变量对因变量没有显著影响 H1:m1,m2,mk不全相等含义:自变量对因变量有显著影响 结论:如果拒绝了原假设,则表明自变量(因子)对因变量有影响。反之,则该因子的不同取值(水平)对因变量不会产生影响。,二、方差分析的基本思想,1、需要进行方差分析吗?,这仅仅是对一个随机样本的观测,而假设检验是对总体的一种推断,因此还需要以样本为基础,运用统计量进行分析。,这仅仅是一个样本!,2、如何分析:核心是构造“离差平方和”,随机差异,结构差异,总差异,3、方差分析的步骤,提出假设 根据离差平方和,构造检验 F 统计量(如下)给定显著性水平a做出(不)拒绝原假设的决策,组间平方和,组内平方和,图解:除式的统计量服从 F 分布,如果MS组间MS组内差,则算出的统计量的值一定在置信区间内,若FF,则拒绝原假设H0,则认为总体之间的差异是显著的。若P,拒绝原假设H0,表明均值之间的差异是显著的,所检验的因子对观察值有显著影响。,11.2.方差分析技术的应用,单因素方差分析,双因素方差分析,一、单因子方差分析,【例】检验超市位置对销售额是否有显著影(=0.05),还记得方差分析的步骤吗?同假设检验是一致的!,单因子方差分析:超市位置和销售量Q(三个样本间的均值),解:提出假设。设不同位置超市销售额的均值分别为1(商业区)、2(居民小区)和3(写字楼),提出的假设为H0:1 2 3(即超市位置对销售额没有显著影响)H1:1,2,3 不全相等(即超市位置对销售额有显著影响)算出离差平方和并构造统计量,算出F的值,拒绝H0,给定显著性水平a=0.05,算出 F 统计量的临界值为3.2849.(请同学们自己练习!)给出决策:方法1(临界值检验):由于统计量值13.35临界值3.28,故拒绝HO.方法2(P值检验):由于统计量p值 显著性水平0.05,故拒绝HO.经济含义:超市位置对销售额有显著影响。,用Excel进行方差分析第1步:选择“工具”下拉菜单第2步:选择【数据分析】选项第3步:在分析工具中选择【单因子方差分析】,然后选择【确定】第4步:当对话框出现时 在【输入区域】方框内键入数据单元格区域 在【】方框内键入0.05(可根据需要确定)在【输出选项】中选择输出区域,2、定量分析:因子对销售额的影响有多大,定性分析:如果拒绝了原假设,则表明因子(自变量)与观测值之间有显著关系,但超市位置对销售额的影响效应到底有多大呢?,定量分析:关系强度(R2)的测定,本题,算出R2=44.74%,R=0.6689。表明超市位置(自变量)对销售额(因变量)的影响效应占总效应的44.74%。尽管并不高,但超市位置对销售额的影响都已经达到了统计上显著的程度。R表明超市位置与销售额之间已达到中等以上的相关性。,二、双因子方差分析,无交互作用的双因子方差分析 如果两个因子对实验结果的影响是相互独立的,分别判断行因子和列因子对实验数据的影响,这时的双因子方差分析称为无交互作用的双因子方差分析(Two-factor without replication)。,有交互作用的双因子方差分析 如果除了行因子和列因子对实验数据的单独影响外,两个因子的搭配还会对结果产生一种新的影响,这时的双因子方差分析称为有交互作用的双因子方差分析。(Two-factor with replication),1、双因子方差分析的两种分类,2、无交互作用的双因子方差分析,【例】有4个品牌的彩电在5个地区销售,为分析彩电的品牌(品牌因子)和销售地区(地区因子)对销售量的影响,对每显著个品牌在各地区的销售量取得以下数据。试分析品牌和销售地区对彩电的销售量是否有显著影响?(=0.05),解题:提出假设,对品牌因子提出的假设为H0:m1=m2=m3=m4(品牌对销售量无显著影响)H1:mi(i=1,2,4)不全相等(品牌有显著影响)对地区因子提出的假设为H0:m1=m2=m3=m4=m5(地区对销售量无显著影响)H1:mj(j=1,2,5)不全相等(地区有显著影响),根据样本算出四种离差平方和,行离差平方和,列离差平方和,残差差平方和,SST=SS行+SS列+SS残差,三个平方和的自由度分别是 总误差平方和SST 的自由度为 kr-1 行因子平方和SSR 的自由度为 k-1 列因子平方和SSC 的自由度为 r-1 误差项平方和SSE 的自由度为(k-1)(r-1),构造统计量F,并算出统计量的F值,判断行因子是否有影响?,判断列因子是否有影响?,双因素方差分析(EXCEL生成),结论:FR18.10777F3.4903,拒绝原假设H0,说明彩电的品牌对销售量有显著影响 FC2.100846 F3.2592,不拒绝原假设H0,不能认为销售地区对彩电的销售量有显著影响,方法2:用P值决策(与显著性水平比较)若PR,拒绝原假设H0,表明均值之间的差异是显著的,即所检验的行因子对观察值有显著影响。若PC,拒绝原假设H0,表明均值之间有显著差异,即所检验的列因子对观察值有显著影响。,用Excel进行无重复双因子分析,例题中的关系强度分析“品牌”因素和“地区”因素合起来总共解释了销售量差异的83.94%其他因素(残差变量)只解释了销售量差异的16.06%R=0.9162,表明品牌和地区两个因素合起来与销售量间有较强的关系。,3、定量分析:双因素方差分析中的关系强度,三、有交互作用的双因子分析,【例】用双因素方差分析,检验超市位置、竞争者数量及二者的交互作用对销售额是否有显著影响(=0.05),对行因子提出的假设为H0:m1=m2=mi=mk(mi为第i个水平的均值)H1:mi(i=1,2,k)不全相等对列因子提出的假设为H0:m1=m2=mj=mr(mj为第j个水平的均值)H1:mj(j=1,2,r)不全相等对交互作用的假设为H0:无交互作用H1:有交互作用,解题:提出假设,你能说出上述例题的假设检验吗?,根据样本算出离差平方和及F 统计量,附录:SST=SS行+SS列+SS交互+SS残差,方差分析与决策:可重复双因素分析,结论:F行35.771F3.403,拒绝原假设H0,说明超市位置对销售量有显著影响 F列14.892 F3.008,拒绝原假设H0,说明竞争者数量对销售量有显著影响F交互3.2838 F2.508,拒绝原假设H0,说明超市位置和竞争者数量的交互影响对销售量也有显著影响,第1步:选择“工具”下拉菜单,并选择【数据分析】选项第2步:在分析工具中选择【方差分析:可重复双因子分 析】,然后选择【确定】第3步:当对话框出现时 在【输入区域】方框内键入数据区域 在【】方框内键入0.05(可根据需要确定)在【每一样本的行数】方框内键入重复实验次数(3)在【输出区域】中选择输出区域 选择【确定】,用Excel进行可重复双因子分析,续前:能分析一下各部分的关系强度吗?(方法同前),第11讲讲完了。谢谢大家!,