方差分析基础.ppt
第六章 方差分析,第一节 方差分析的基本原理,前面所介绍的t检验法和u检验法,适用于样本平均数与总体平均数及两样本平均数间的差异显著性检验,但在生产和科学研究中经常会遇到比较多个处理(k3)优劣的问题,即需进行多个平均数间的差异显著性检验。这时,若仍采用t或u检验法就不适宜了。原因如下:,1、检验过程烦琐 例如,一试验包含5个处理,采用t检验法要进行=10次两两平均数的差异显著性检验;若有k个处理,则要作k(k-1)/2次类似的检验。2、无统一的试验误差,误差估计的精确性和检验的灵敏性低 对同一试验的多个处理进行比较时,应该有一个统一的试验误差的估计值。3、推断的可靠性低,检验的I型错误率大 即使利用资料所提供的全部信息估计了试验误差,若用t检验法进行多个处理平均数间的差异显著性检验,由于没有考虑相互比较的两个平均数的秩次问题,因而会增大犯I型错误的概率,降低推断的可靠性。,复习几个常用术语,1、试验指标:为衡量试验结果的好坏或处理效应的高低,在试验中具体测定的性状或观测的项目称为试验指标。由于试验目的不同,选择的试验指标也不相同。2、试验因素:试验中所研究的影响试验指标的因素叫试验因素。3、因素水平:试验因素所处的某种特定状态或数量等级称为因素水平,简称水平。,复习几个常用术语,4、试验处理:事先设计好的实施在试验单位上的具体项目叫试验处理,简称处理。在单因素试验中,实施在试验单位上的具体项目就是试验因素的某一水平。进行单因素试验时,试验因素的一个水平就是一个处理。在多因素试验中,实施在试验单位上的具体项目是各因素的某一水平组合。5、试验单位:在试验中能接受不同试验处理的独立的试验载体叫试验单位。6、重复:在试验中,将一个处理实施在两个或两个以上的试验单位上,称为处理有重复;一处理实施的试验单位数称为处理的重复数。,自由度和平方和的分解,总变异是nk个观察值的变异,所以其自由度为nk-1总变异的平方和为:,自由度和平方和的分解,组间(处理)变异由k个yi变异所引起,故其自由度为k-1,组间(处理)平方和为:组内(误差)变异为各观察值与组平均数的变异,所以组内(误差变异自由度为k(n-1),组内平方和为:,自由度和平方和的分解,总自由度DFT组间自由度DFt组内自由度DFe总平方和SST组间平方和SSt+组内平方和SSe总的均方:组间的均方:组内的均方:,自由度和平方和的分解,以、四种药剂处理水稻种子,其中为对照,每处理各得个苗高观察值(cm),其结果列于下表,试分解其平方和与自由度,自由度和平方和的分解,总变异自由度:DFT=(nk-1)=(44)-1=15药剂间自由度:DFt=(k-1)=4-1=3药剂内自由度:DFe=k(n-1)=4(4-1)=12矫正数总的平方和:组间平方和:组内平方和:,二、F分布与F测验,从例题如手,理解方差分析的基本原理:,一小麦品种对比试验,6个品种,4次重复,单因素完全随机设计,得产量结果如下表(单位:kg/小区),从表中的结果可以看出:,24个小区的产量有高有低,存在差异,这种差异称为变异。各处理平均产量之间也有差异,可以直观地看作是小麦不同品种间生产能力的差异。同一品种不同重复之间的产量也不相同,显然这种差异主要不是小麦品种引起的,而是某些不易控制的随机因素的影响,是由随机误差造成的。由于试验误差的存在,不同品种产量之间的差异是纯属随机误差的影响还是反映了不同品种的影响?这就需要对品种效应作进一步考察,分析造差异的原因是什么,以判断试验结果的可靠性和品种产量间差异的显著性。,由此看出:,无论试验条件控制多么严格,在其试验结果中总是掺杂着随机误差等非处理因素的影响,说明试验结果的总变异是由两类原因引起的:由于人为施加试验条件的影响引起试验指标的变异,称处理间(组间)变异。其效应称处理效应。由随机因素的影响引起的变异,称处理内(组内)变异。其效应称非处理效应。即:试验结果总变异处理间变异处理内变异,基本思路:,方差分析就是从试验结果的变异性出发,用方差作为衡量各种变异量的尺度,如用总方差表示总变异,处理间方差表示处理间变异,处理内方差表示处理内变异(可以看作为误差),则哪项方差大,那项因子对试验指标的影响就大,把处理方差和误差方差在一定意义下进行比较,当处理间方差显著地大于误差方差时,表明处理因素对试验指标有显著影响。,概念,方差分析:就是将试验数据的总变异分解为来源不同因素的相应变异,并做出数量估计,从而发现各个因素在总变异中所占的重要程度。即将试验的总变异方差分解成各变因方差,并以其中误差方差作为和其他变因方差比较的标准,以推断其他变因所引起的变异量是否真实的一种统计分析方法。,方差分析的基本步骤,(一)平方和与自由度的分解(二)F检验(三)多重比较详细内容见教材P89!,第二节 单向分组资料方差分析,单向分组资料是指观察值按一个方向分组的资料。组内观察值数目相等的单向分组资料组内观察值数目不等的单向分组资料,组内观察值数目相等的单向分组资料的方差分析,例:在栽培条件一致的情况下,比较5个梨品种产量,每品种随机抽取3个样点(每样点株数相同),结果如下表,进行方差分析。(单位:kg/样点),组内观察值数目不等的单向分组资料的方差分析,例:调查了元帅短枝型1号树和2号树,及普通型与小老树的枝条节间平均长度,各组观察值数目不等,见下表,进行方差分析。表2 元帅不同类型树枝条节间长度(单位:cm),作业:,1 假设有4个小麦新品系,进行完全随机盆栽试验,其结果如下表,试作方差分析。,2 对A、B、C、D、E等5个杂交水稻品种的干物质积累过程进行测定,每次每品种随机取2个样点,每点5株,其中一次的结果如下表,试作方差分析。,练习1:测定4种种植密度下金皇后玉米的千粒重(g)各4次,得结果如下表。试作方差分析。,练习2:以稻草(A1)、麦草(A2)、和花生秸(A3)三种培养基,在28(B1)、32(B2)、36(B3)三种温度下,培养草菇菌种,研究其菌丝生长速度。完全随机设计,每个处理组合培养3瓶。记载从接种到菌发满全瓶的天数。结果如下表,试作方差分析。,两向分组资料的方差分析,两向分组资料是指试验指标同时受两个因素的作用而得到的观测值,又叫交叉分组。按完全随机设计的两因素试验数据,都是两向分组资料,其方差分析按各组合内有无重复观测值分为两种不同情况。,两向分组资料的方差分析,组合内只有单个观察值的两向分组资料的方差分析:完全随机设计的二因素试验每处理组合只有一个观察值的资料:注意方差分析中,不考虑两因素之间的互作(若互作存在,则与误差混淆,无法分析互作,也不能取得合理的试验误差估计。),两向分组资料的方差分析,例:将某经济树种苗木栽在4块不同的苗床上,每块苗床上的苗木又分别使用三种不同的肥料观察肥效差异,一年后于每一苗床的各施肥小区内用重复抽样方式各抽取苗木若干株,测其平均高,得资料如下表。设已知苗高的分布近似正态,等方差。试问不同肥料(A)和不同苗床(B)对苗木高生长有无显著影响?,