方差分析与试验设计徐维军.ppt
《方差分析与试验设计徐维军.ppt》由会员分享,可在线阅读,更多相关《方差分析与试验设计徐维军.ppt(120页珍藏版)》请在三一办公上搜索。
1、华南理工大学精品课程,第六章 方差分析与试验设计,引例:饮料行业作为改革开放以来发展起来的新兴行业,是中国消费品中的发展热点和新增长点。饮料行业不断地发展和成熟,逐渐改变了以往规模小、产品结构单一、竞争无序的局面,饮料企业的规模和集约化程度不断提高,产品结构日趋合理。就目前中国饮料在品牌方面的发展而言,全国性品牌已有十几家,加多宝、鲜橙多、汇源、娃哈哈等已为人们所熟知。,假若某饮料公司研制出一种新型饮料,该饮料有无色透明、青绿色、茶色、淡黄色和粉色五种颜色,除颜色外,其它包装、产品广告、价格、味道、营养含量等因素全部相同。该公司为了了解这种不同颜色饮料的销售量状况,以便合理制订产品优势策略,针
2、对性对有颜色差异的饮料进行市场推广。现从经营规模相仿的六家超市同时收集该种饮料在一个月内的销售情况。试分析这五种不同颜色饮料的销售量是否有显著差异。,华南理工大学精品课程,2,华南理工大学精品课程,3,提出问题,饮料的销售量会受到颜色的影响吗?,Q1,Q2,Q3,如何比较不同颜色饮料对销量的影响?,Q4,方差分析与试验设计有联系吗?,Q5,不同的销售区域对销量有影响吗?,饮料颜色与销售区域会产生交互作用?,华南理工大学精品课程,4,学习目标,掌握方差分析的概念和基本思想掌握单因素方差分析的方法及应用理解多重比较的意义掌握双因素方差分析的方法及应用了解试验设计的基本原则和常用方法,华南理工大学精
3、品课程,5,学习内容,方差分析的基本问题单因素方差分析单因素方差分析中的多重比较双因素方差分析试验设计,华南理工大学精品课程,6,第一节 方差分析引论,6.1,6.2,6.3,6.4,具体章节结构,第二节 单因素方差分析,第三节 双因素方差分析,第四节 试验设计,华南理工大学精品课程,7,第一节 方差分析引论,一、方差分析问题的提出二、方差分析的基本概念三、方差分析的基本假定四、方差分析前提假定检验及破坏 五、方差分析的基本思想和原理六、问题的一般提法,华南理工大学精品课程,8,一、方差分析问题的提出,【例6-1】针对引例中要求分析五种不同颜色饮料的销售量是否有显著差异,现从地理位置、经营规模
4、相仿的六家超市同时收集的该饮料一个月内的销售情况如下表:表6-1 五种不同颜色饮料的销售量,华南理工大学精品课程,9,一、方差分析问题的提出,分析五种不同颜色饮料的销售量是否有显著差异,即要判断“颜色”对“销售量”是否有显著影响。作出这种判断最终被归结为检验这五个颜色饮料的销售量的均值是否相等。若它们的均值全都相等,则意味着“饮料颜色”对饮料的销售数量是没有影响的;若它们的均值不全相等,则意味着“饮料颜色”对其销售数量是有影响的。,华南理工大学精品课程,10,二、方差分析的基本概念,方差分析:简称 ANOVA(Analysis of Variance),该统计分析方法能一次性地检验多个总体均值
5、是否存在显著差异。,华南理工大学精品课程,11,二、方差分析的基本概念,试验指标:不同条件下所作的试验结果。如,要检验五种不同颜色饮料的销售量是否有显著差异,饮料的销售量是在不同颜色下的试验结果,称为试验指标。因素或因子(Factor):试验中需要考察的、可以控制的条件。如,饮料的颜色是所要考察的对象,称为因素或因子。水平或处理(Level):因素所处的不同状态。如,无色透明、青绿色、茶色、淡黄色和粉色是饮料颜色这一因子不同状态的具体表现,称为因子的水平。,华南理工大学精品课程,12,二、方差分析的基本概念,观察值:每个因子水平下得到的样本数据。如,在超市中收集的每种颜色对应的饮料销售量的样本
6、数据称为观测值。自变量和因变量。如,研究饮料的颜色对销售量是否有影响,即饮料的颜色是自变量,它是一个分类型的变量;销售量就是因变量,是一个数值型变量;不同颜色饮料的销售量就是因变量的取值。,华南理工大学精品课程,13,三、方差分析的基本假定,每个总体都应服从正态分布 对于因素的每一个水平,其观察值是来自服从正态分布总体的简单随机样本,如,饮料的每种颜色的销售量必须服从正态分布。各个总体的方差必须相同 各组观察数据是从具有相同方差的总体中抽取的,如,五种不同颜色饮料的销售量的方差都相等。观察值是独立的 如,每种颜色饮料的销量与其它颜色的销量无关。,华南理工大学精品课程,14,三、方差分析的基本假
7、定,在上述假定条件下,判断饮料颜色对销售量是否有显著影响,实际上也就是检验具有同方差的五个正态总体的均值是否相等。如果五个总体的均值相等,可以期望五个样本的均值也会很接近。即是五个样本的均值越接近,推断五个总体均值相等的证据也就越充分,样本均值越不同,推断总体均值不同的证据就越充分。,华南理工大学精品课程,15,三、方差分析的基本假定,如果假设 成立:五种不同颜色饮料的销售量总体的均值都相等。意味着每个样本都来自均值为、方差为 的同一个正态总体。,华南理工大学精品课程,16,三、方差分析的基本假定,如果假设 不成立:说明五个样本总体中至少有两个的均值是不同的。假设只有样本3与其它样本是来自不同
8、的总体,即有 但。,华南理工大学精品课程,17,四、方差分析前提假定检验及破坏,独立分布假定检验 随机样本是来自无限容量的总体或有放回的有限容量的总体,观测值的独立性假定都能得到满足。正态性假定检验 用粗略的样本数据分布图来判断。方差齐性假定检验 Cochran检验、最大F比检验、Bartlett检验等。,华南理工大学精品课程,18,四、方差分析前提假定检验及破坏,方差齐性假定检验-Bartlett检验(1)提出假设 样本总体的方差是相同的 不全相等 至少有两个样本总体的方差不同(2)计算方差,构造统计量,华南理工大学精品课程,19,四、方差分析前提假定检验及破坏,方差齐性假定检验-Bartl
9、ett检验检验统计量B的观测值b为:其中:原假设 成立,满足。判断方差是否相同的决策规则为:当 时,则拒绝原假设,认为至少有两个处理组数据的方差是不相等的;否则,认为数据满足分析中方差齐性的要求。,华南理工大学精品课程,20,五、方差分析的基本思想和原理,样本数据波动有二个来源,一个是同一因素中的不同水平造成的,另一个是由于抽选样本的随机性而产生的波动。两个方面产生的波动可以用两个方差来计量,一个称为水平之间的方差,即组间方差;另一个称为水平内部的方差,即组内方差。前者包括系统性因素,也包括随机性因素,后者仅包括随机性因素。,总变异,组间变异,组内变异,华南理工大学精品课程,21,五、方差分析
10、的基本思想和原理,组间方差反映出不同的因子对样本波动的影响;组内方差则是不考虑组间方差的纯随机影响。如果不同水平对结果没有影响,则组间方差中仅仅有随机因素的差异,而没有系统性的差异,它与水平内部的组内方差就应该近似,两个方差比值接近于1。反之,两个方差的比值就会显著地大于1,当这个比值大到某个程度,或者说达到某临界点,就可以判断出不同水平之间存在着显著性差异。小概率原理仍然是方差分析的指导思想。,华南理工大学精品课程,22,五、方差分析的基本思想和原理,因素或因素间“交互作用”对观测结果的影响是否显著,关键要看组间方差与组内方差的比较结果。当然,产生方差的独立变量的个数对方差大小也有影响,独立
11、变量个数越多,方差就有可能越大;独立变量个数越少,方差就有可能越小。为了消除独立变量个数对方差大小的影响,用方差除以独立变量个数,得到均方差(Mean Square),作为不同来源方差比较的基础。引起方差的独立变量的个数,称为自由度。,华南理工大学精品课程,23,五、方差分析的基本思想和原理,检验因子影响是否显著通常用如下F统计量:F统计量越大,越说明组间方差是主要方差来源,因子的影响越显著。F统计量越小,越说明随机方差是主要的方差来源,因子的影响越不显著。,华南理工大学精品课程,24,六、问题的一般提法,因素有r个水平,每个水平的均值分别用 表示要检验r个水平(总体)的均值是否相等,需要提出
12、如下假设:H0:H1:不全相等,华南理工大学精品课程,25,第二节 单因素方差分析,一、数据结构二、分析步骤三、应用实例分析四、关系强度的测量五、用Excel进行方差分析六、方差分析中的多重比较,华南理工大学精品课程,26,一、数据结构,单因素方差分析数据结构,其中:,表6-2 单因素方差分析试验数据的数据结构,华南理工大学精品课程,27,二、分析步骤,第1步:提出假设 H0:1 2 r 自变量对因变量没有显著影响 H1:1,2,,r 不全相等 自变量对因变量有显著影响,华南理工大学精品课程,28,二、分析步骤,总离差平方和SST反映了离差平方和的总体情况误差项离差平方和SSE反映的是水平内部
13、,或组内观察值的离散状况,第2步:构造检验统计量,1)计算误差平方和,华南理工大学精品课程,29,二、分析步骤,水平项离差平方和SSA反映的是组间差异总离差平方和 SST=SSE+SSA,华南理工大学精品课程,30,二、分析步骤,SST是由所有观测值的波动引起的误差,但是,这里所有的n个变量并不独立,它们满足一个约束条件,真正独立的变量只有n-1个,自由度是n-1。SSA是因子在不同水平上的均值变化而产生的误差。但是,r个均值并不是独立的,它们满足一个约束条件,因此也丢失一个自由度,它的自由度是r-1。SSE是由所有的各因素观测值围绕对应水平均值波动产生的误差,它们满足的约束条件一共r个,失去
14、了r个自由度,所以SSE的自由度是n-r。SST、SSA和SSE的自由度满足如下关系:n-1=(r-1)+(n-r),2)自由度的确定,华南理工大学精品课程,31,二、分析步骤,检验统计量是:F值越大,越说明总的方差波动中,组间方差是主要部分,有利于拒绝原假设接受备选假设。F值越小,越说明随机方差是主要的方差来源,有利于接受原假设,没有充分证据说明待检验的因素对总体波动有显著影响。,其中:,华南理工大学精品课程,32,二、分析步骤,检验的拒绝域安排在右侧:,第三步:统计决策,图6-3 统计量F的抽样分布,华南理工大学精品课程,33,二、分析步骤,将统计量的值F与给定的显著性水平的临界值F进行比
15、较,作出对原假设H0的决策:根据给定的显著性水平,在F分布表中查找与第一自由度df1r-1、第二自由度df2=n-r 相应的临界值 F。若FF,则拒绝原假设H0,表明均值之间的差异是显著的,所检验的因素对观察值有显著影响。若FF,则不能拒绝原假设H0,表明所检验的因素对观察值没有显著影响。,华南理工大学精品课程,34,二、分析步骤,根据上述步骤及计算的数据,列出方差分析表6-3。,表6-3 单因素方差分析表,华南理工大学精品课程,35,分析例6-1所提到某饮料公司新型饮料的不同饮料颜色对其销售量是否有显著差异。,表6-1 五种不同颜色饮料的销售量,三、应用实例,华南理工大学精品课程,36,三、
16、应用实例,华南理工大学精品课程,37,三、应用实例,3)给定显著性水平,根据第一自由度df1=4,第二自由度df2=25,查F分布表得临界值。由于,拒绝原假设,即 不成立,表明它们之间有显著差异,可认为饮料颜色对其销量有显著影响。,华南理工大学精品课程,38,三、应用实例,表6-4 单因素应用实例方差分析表,为清楚看出例6-1方差分析的计算过程和结果,可以列成下方差分析表6-4。,华南理工大学精品课程,39,四、关系强度的测量,拒绝原假设表明因素(自变量)与观测值之间有关系。组间平方和(SSA)度量了自变量(饮料颜色)对因变量(销售量)的影响效应:只要组间平方和SSA不等于0,就表明两个变量之
17、间有关系(只是是否显著的问题)。当组间平方和SSA比组内平方和SSE大,且大到一定程度时,就意味着两个变量之间的关系显著,大得越多,表明它们之间的关系就越强。反之,小得越多,表明它们之间的关系就越弱。,华南理工大学精品课程,40,四、关系强度的测量,变量间关系的强度用自变量平方和SSA及残差平方和SSE 占总平方和SST 的比例大小来反映。自变量平方和占总平方和的比例记为R 2,即其平方根R就可以用来测量两个变量之间的关系强度。,华南理工大学精品课程,41,四、关系强度的测量,结论:饮料的颜色(自变量)对其销售量(因变量)的影响效应占总效应的77.82%,而残差效应则占22.18%。即饮料颜色
18、对销量差异解释的比例达到77%以上,而其它因素(残差变量)所解释的比例接近为23%。R=0.8821表明饮料颜色与销量之间有较强的关系。,例题6-1分析:计算可得,华南理工大学精品课程,42,五、用Excel进行方差分析,第1步:选择“工具栏”中“数据”项的“数据分析”选项;第2步:在分析工具中选择“单因素方差分析”,然后选择“确定”;第3步:当对话框出现时 在“输入区域”方框内键入数据的单元格区域(本例 是 B1:F7);在“分组方式”选择“列”(如果水平为行变量,则选 择“行”),勾选“标志于第一行”;在“方框”内键入0.05(可根据需要确定);在“输出选项”中选择输出区域,如图6-4示。
19、,华南理工大学精品课程,43,图6-4 Excel进行单因素方差分析的步骤,五、用Excel进行方差分析,华南理工大学精品课程,44,表6-5 单因素方差分析Excel输出结果,五、用Excel进行方差分析,决策判断:,拒绝原假设,华南理工大学精品课程,45,六、方差分析中的多重比较,通过方差分析方法可以判断各总体均值是否相等。如果不相等,那么如何进一步检验到底是哪些均值之间存在差异?多重比较方法通过对总体均值之间的配对比较来进一步检验到底是哪些均值之间存在差异。多重比较分析方法有很多种,如Tukey检验、Bonferroni t检验、Sidak检验法等,这里介绍最常用的LSD检验法和LSR检
20、验法。,多重比较的意义,华南理工大学精品课程,46,六、方差分析中的多重比较,1最小显著差异法(Least Significant Difference)(R.A.Fisher提出,简称LSD),LSD方法是对检验两个总体均值是否相等的t检验方法的总体方差估计加以修正(用MSE来代替)而得到的。,华南理工大学精品课程,47,六、方差分析中的多重比较,LSD方法的步骤:,华南理工大学精品课程,48,六、方差分析中的多重比较,LSD方法的实例分析:,华南理工大学精品课程,49,六、方差分析中的多重比较,华南理工大学精品课程,50,六、方差分析中的多重比较,华南理工大学精品课程,51,六、方差分析中
21、的多重比较,华南理工大学精品课程,52,六、方差分析中的多重比较,2最小显著极差值(Least Significant Range)(Duncan提出,简称LSR),Duncan多重极差检验法是不同平均数间用不同的显著差数标准进行比较的方法,依据极差范围内所包含的处理数据(也称为秩次距)k的不同而采用不同的检验尺度。,华南理工大学精品课程,53,六、方差分析中的多重比较,LSR方法的步骤:,华南理工大学精品课程,54,第三节 双因素方差分析,一、双因素方差分析及其类型二、无交互作用的双因素方差分析三、有交互作用的双因素方差分析,华南理工大学精品课程,55,一、双因素方差分析及其类型,单因素方差
22、分析只考虑一个分类型自变量对数值型因变量的影响。在对实际问题的研究中,有时需要考虑几个因素对实验结果的影响。例如,分析影响某种产品销售量的因素时,需要考虑品牌、销售地区、价格、质量和广告策略等多个因素的影响。当方差分析中涉及两个分类型自变量时,称为双因素方差分析(Two-way Analysis of Variance)在获取数据时,需要将一个因素安排在“行”(row)的位置,称为行因素,另一个因素安排在“列”(column)的位置,称为列因素。,华南理工大学精品课程,56,一、双因素方差分析及其类型,双因素方差分析的分类依据:两因素之间的效应是否独立双因素方差分析的类型:无交互作用的双因素方
23、差分析 两个因素对试验结果的影响是相互独立的。有交互作用的双因素方差分析 两个因素的搭配会对试验数据产生一种新的影响。如,某个地区的消费者对某种饮料颜色有特殊的偏好,即“销售地区”和“颜色”结合的效应。,华南理工大学精品课程,57,一、双因素方差分析及其类型,每个总体都服从正态分布 对于因素的每一个水平,其观察值是来自正态分布总体的简单随机样本各个总体的方差必须相同 对于各组观察数据,是从具有相同方差的总体中抽取的观察值是独立的,华南理工大学精品课程,58,二、无交互作用的双因素方差分析,无交互作用的双因素方差分析数据结构,表6-6 无交互作用方差分析试验数据的数据结构,华南理工大学精品课程,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 方差分析 试验 设计 徐维军

链接地址:https://www.31ppt.com/p-6473052.html