语言统计第十章 F分布及其应用ppt课件.ppt
《语言统计第十章 F分布及其应用ppt课件.ppt》由会员分享,可在线阅读,更多相关《语言统计第十章 F分布及其应用ppt课件.ppt(41页珍藏版)》请在三一办公上搜索。
1、第十章 F分布及其应用,第一节 F分布第二节 F分布的应用方差的同质性检验第三节 F分布的应用方差分析 一、为什么需要方差分析 二、方差分析的条件 三、单因素方差分析与多因素方差分析 四、方差分析的基本原理 五、单因素方差分析 六、双因素方差分析,第一节 F分布,F分布也是一种抽样分布。 F分布与方差有关。假如我们从一个正态总体中,或者从两个方差相同的正态总休中, 抽取两个样本, 分别记为 和 , 其方差则为和 ,我们再计算出两个样本的方差的比值 。 如果我们重复这一步骤, 抽取多对样本,那么就可以计算出多个F值。这些F值的分布是怎样的呢?其分布为F分布。,F分布为正偏态分布,它的形状不是固定
2、的,而是随样本的大小而变化。 这里, “样本大小” 仍用 “自由度”(df)的概念来表示。由于计算方差比值时涉及两个样本,所以自由度也涉及两个样本,具体来讲,就是 和 , 即在方差比值中作分子的样本的容量减1和作分母的样本的容量减1, 分别记为 和 。随着样本容量的增大,分布偏态的程度越来越小,越来越接近正态分布。,第二节 F分布的应用方差的同质性检验,分布的应用主要有两类:一是检验两个样本所来自的总体的方差是否相等,即检验方差的同质性;二是方差分析。F检验,其过程如下:第一步: 陈述零假设 和备择假设 。在F检验中, 零假设为 ,而备择假设的形式则要视所预测的差异的方向来定:如果是无方向的,
3、 则为 (即双尾检验) ; 如果是有方向的, 则为 或 (即单尾检验) 。,第二步: 设定显著水平 。 第三步:分别计算两个样本的方差 第四步:计算检验统计值,即两样本方差的比值 F ,计算F值时,用较大的方差作分子,用较小的方差作分母,因而F值总是大于1。 第五步:根据自由度 ( ) 以及所设定的显著水平, 从F分布中查出临界值。 第六步:比较检验统计值和临界值。如果检验统计值等于或大于临界值,则推翻零假设,表明总体方差有显著的差异;否则,就接受零假设表明两总体方差之间没有显著的差异 (注意: “没有显著差异” 不等于 “没有差异” ) , 就方差而言, 也可以说两样本来自同一个总体。,第三
4、节 F分布的应用方差分析,方差分析是F分布最重要的用途之一。方差分析比较复杂,常常需要使用专门的电脑统计软件(如SPSS)。这里,我们只简要讨论一下方差分析的基本原理并举例说明最简单的方差分析的方法和应用。 一、为什么需要方差分析? 简单来讲,方差分析是t检验的一种特殊情况。检验仅适用于检验两个样本平均数之间的差异是否显著。运用方差分析,就可以把几个样本平均数同时加以比较,看看它们有没有显著差异。因而方差分析是语言研究中非常常用、非常重要的一个统计分析手段。,二、 方差分析的条件 方差分析是一个参数检验,必须满足下列条件: (1)样本为独立样本; (2)总体分布为正态; (3)总体方差相等。
5、其中,第三个条件可以放松一些,因为即使总体方差之间有些差异,如果各组的样本容量大体相同,也不会对方差分析的结果造成大的影响,因为在这种条件下,方差分析对方差同质性的偏离不是很敏感。但是,如果样本容量差别很大,而总体方差又不相同,就要谨慎了。,三、 单因素方差分析与多因素方差分析 方差分析分单因素方差分析与多因素方差分析。所谓“因素”,简而言之,就是实验研究所涉及的自变量。比如,我们要研究不同的教学方法对学习成绩的影响, 所涉及的自变量就是 “教学方法” ; 再比如, 要研究语言难度与内容熟悉程度对阅读理解的影响, 就要涉及 “语言难度” 和 “内容熟悉程度” 这两个自变量。 从另一个角度看,
6、“因素” 也可以称为 “分组变量”,因为我们以该变量为标准把因变量(我们所收集的数据)分成若干组。,四、 方差分析的基本原理 方差分析是利用F分布来决定几个平均数之间是否有显著差异。 对于一组数据,该变异是由各 方差代表着数据的变异或离散情况个观测值之间的差异造成的。如果我们的数据是由几组数据组成的,那么数据的总变异就来自两个方面或是由两个变异源造成的:一是各组内部的差异由抽样所带来的观测值之间的差异,我们称之为“组内变异” ; 二是各组平均数之间的差异, 称为 “组间变异” 。,五、 单因素方差分析 1.总变异的分解 从以上分析可以看出,方差分析的关键是把数据的总变异分解为两个部分:反映各组
7、内观测值离散程度的组内变异和反映各组平均值之间差异大小的组间变异。因此,我们先来看看如何分解总变异。 我们知道, 数据的变异是用方差 (或标准差) 来表示的。 我们知道, 方差的计算公式为,我们在分解总变异时,被分解的实质上是 这一部分, 即离均差的平方和。 为了讨论方便,我们先引入几个符号: 表示数据的总变异(即总平方和) 表示组间变异(即组间平方和) 表示组内变异(即组内平方和) 也有人用RSS表示组内变异。RSS为英文residual sum of squares的缩写,意为 “剩余平方和” 。因为总平方和等于组间平方和与组内平方和了。我们只要计算出总平方和与组间平方和,两者相减就可得出
8、组内平方和了。,2.单因素方差分析的步骤 第一步: 提出零假设 (即各组数值或各样本所来自的总体的平均值之间没有差异,m表示组数或样本数)。 第二步:设定显著水平。 第三步: 计算总平方和 。由于 反映整个数据的离散情况,所以用下面的公式 式中 X 全部数据中的每个观测值 X 所有观测值的总平均数。,(10.1),第四步: 计算组间平方和 。由于 反映各组平均数之间的离散情况, 所以用下式,(10.3),为了计算方便,一般用下面的公式,第五步: 求组内平方和 。由于总平方和是组内和组间平方和之和, 所以计算出 和 之后,两者相减,就可得出 当然, 也可以用公式求出 , 公式为 另一个简单一些的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 语言统计第十章 F分布及其应用ppt课件 语言 统计 第十 分布 及其 应用 ppt 课件
链接地址:https://www.31ppt.com/p-1443489.html