《[教育学]心理统计学.doc》由会员分享,可在线阅读,更多相关《[教育学]心理统计学.doc(32页珍藏版)》请在三一办公上搜索。
1、心理统计学第一节 统计方法在心理学研究中的应用一、心理统计的定义和性质 统计学最初指的是对一个国家情况的描述。 现代意义上的统计指的是对与随机现象有关的数据资料进行收集、整理、计算和分析的过程。 统计学大致分为理论统计学 和应用统计学 。 理论统计学 研究如何从局部的样本观测数据资料来推断总体的特征,并得出合乎规律的科学结论的原理和方法。 应用统计学 研究如何运用经理论统计学证明的各种原理和方法解决实际问题。 心理统计学属于应用统计学。 心理统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理活动规律的一
2、门学科。 心理统计学作为一门应用统计学科,与数理统计学既有密切联系,又不完全相同。 心理统计偏重于数理统计方法如何在心理和教育科学研究中的应用,着重介绍各种统计方法在不同的心理学研究中应用的条件和具体方法,及其统计计算结果的解释。二、心理学研究数据的特点 心理学研究数据与结果多用数字形式呈现。 心理学研究数据具有随机性和变异性。 心理学研究数据具有规律性。心理学研究的目标:通过部分数据来推测总体特征。 心理统计使我们能以最少的样本含量,达到我们所需要的精确度,对总体的有关参数等作出判断,同时又给出发生错误的可能性。它保证了科学研究的精确性、可靠性和经济性。 三学习心理统计的意义 数学化是自然科
3、学成熟的标志。心理学也必然会向数学化的方向发展,而心理统计就是用数学方法研究心理活动的重要工具。 学习心理专业的课程需要统计学知识。 从事心理学相关工作需要统计学知识。 进行心理学研究需要统计学知识。 科学的思维需要统计学知识。 四、学习心理统计应注意的事项(一)学习心理统计学要注意的几个问题 必须要克服畏难情绪。 注意重点掌握各种统计方法使用的条件。 要做一定的练习。(二)应用心理统计方法时要切记的要点 克服“统计无用”与“统计万能”的思想,注意科研道德 正确选用统计方法,防止误用和乱用统计第二节 心理统计学的内容一、描述统计描述统计主要研究如何整理心理学实验或调查得来的大量数据,描述一组数
4、据的全貌,表达一件事物的性质。目的:将大量零散的、杂乱无序的数字资料进行整理 、归纳 、简缩 、概括 ,使事物的全貌及其分布特征清晰、明确地显现出来。二、推论统计 推论统计主要研究如何通过局部数据所提供的信息,推论总体的情形。即,根据样本提供的信息,运用概率理论进行分析、论证,在一定可靠程度上,对总体分布特征进行估计 、推测。 统计学中较为重要、应用较多的内容。 目的:根据已知的情况,在一定概率的意义上估计、推测未知的情况。 内容:包括总体参数估计和假设检验。三、实验设计 实验设计主要目的在于研究如何科学地、经济地以及更有效地进行实验。即,实验者为了揭示实验中自变量与因变量之间的关系,在实验之
5、前所制订的实验计划。 是统计学近几十年发展起来的内容。 包括:选择抽样方式;计算样本容量;如何安排实验因素;如何控制无关因素;用什么统计方法处理及分析实验结果,等等。统计图表差异量数集中量数相关分析心理与教育统计描述统计推论统计实验设计统计估计假设检验参数估计非参数估计点估计区间估计参数检验非参数检验样本选择与分配实验误差分析方差分析协方差分析回归分析因子分析图1 心理与教育统计研究内容第三节 心理统计学的发展 最初的统计是统治者用以治国的方法,对于人口、土地、物产、贡赋、士兵与战车等都需要统计。这类统计是记录或描述已经发生的各种现象,可以称为描述性统计。 随着科学进步,近百年来,在概率论基础
6、上逐步形成了推测性的数理统计。19世纪中期奠定了概率论的理论基础。一、理论统计学的发展历史 统计学的理论基础是概率论与正态分布曲线方程的产生。 一般认为理论统计学的发展经历了两个阶段:描述统计阶段和推论统计阶段。描述统计阶段 描述统计学产生于20世纪年代之前,在描述统计方面做出重要贡献的是英国的优生学家高尔顿 (FGalton )和统计学家皮尔逊 (Kpearson )。推论统计阶段 推论统计的先驱是英国统计学家格赛特 (WGosset ),对推断统计做出重要贡献的是英国统计学家费舍尔 (RAFisher ) 。 二次世界大战以后,各种非参数统计方法、小样本理论都得到发展和完善,同时多元统计的
7、理论和方法也得到了广泛的应用,统计学形成了许多分支应用学科。二心理与教育统计的产生和发展 心理与教育统计作为数理统计的一门应用学科,是随着数理统计的发展而发展的。 最初应用统计方法于教育与心理方面研究的是高尔顿 。 对教育统计做出重要贡献的是心理学家斯皮尔曼 (Ch.E.Spearman )。 随着科学研究中心的转移,心理与教育统计的研究也移向美国。为心理与教育统计学做出较大贡献的是美国教育与心理学家桑代克 (Thorndikt )、瑟斯顿 (Thurstone )和卡特尔 (Cattell )。 三我国心理与教育统计学的发展概况 心理与教育统计学在辛亥革命以后传到我国。当时心理与教育统计、心
8、理与教育测量都作为高等、中等师范院校的必修课程,有一大批专家、学者从事这方面的研究、讲授工作,出版了不少关于教育统计方面的译著、专著。 20世纪年代以后,心理与教育统计学开始复苏。在二十多年中,我国的心理与教育统计学科在教学、研究、培养人才等各方面取得了非常丰硕的成果。 目前,心理与教育统计学的教学和研究进入稳步快速发展时期。第四节 心理与教育统计基础概念一、数据类型(一)从数据的观测方法和来源划分 计数数据:计算个数的数据,一般属性的调查获得的是此类数据,它具有独立的分类单位,一般都取整数形式。 测量数据:借助于一定的测量工具或一定的测量标准而获得的数据。(二)根据数据反映的测量水平 称名数
9、据:只说明某一事物与其他事物在属性上的不同或类别上的差异,具有独立的分类单位,其数值一般都取整数形式,只计算个数,并不说明事物之间差异的大小,只能用具有相同属性的个体数目来统计。 顺序数据:既无相等单位,也无绝对零的数据,是按事物某种属性的多少或大小,按次序将各个事物加以排列后获得的数据资料。 这种数据只能排出一个顺序,不能指出相互间的差别大小。 这类数据不能进行加减乘除运算。 等距数据(interval data)是有相等单位,但无绝对零的数据,只能使用加减运算,不能使用乘除运算。等距数据在某个区间里具有相等单位。 比较时只能用加减法,不能使用乘除法。 比率数据(ratio data)既表明
10、量的大小,也有相等的单位,同时还具有绝对零点。(三)按照数据是否具有连续性 离散数据:又称为不连续数据,这类数据在任何两个数据点之间所取的数值的个数是有限的。 连续数据:指任意两个数据点之间都可以细分出无限多个大小不同的数值。二、变量、观测值、随机变量 变量是指心理与教育实验、观察、调查中想要获得的数据。 用来表示随机现象的变量,称为随机变量。一般用大写的或表示随机变量。 随机变量所取得的值,称为观测值。一个随机变量可以有许多个观测值。三、总体、样本与个体测量数据计数数据 总体,又称全体、全域,指具有某种特征的一类事物的全体。总体是所欲研究的某一类对象的全体,总体的大小随研究的问题而改变。 个
11、体是构成总体的每个基本单元。 样本是从总体中抽取的一部分个体。 一般把容量n 30的样本称为大样本; 而n 30的样本称为小样本。四、次数、比率、频率与概率 次数是指某一事件在某一类别中出现的数目,又称为频数,用f表示。 两个数的比称比率。 频率,又称相对次数,即某一事件发生的次数被总的事件数目除,亦即某一数据出现的次数被这一组数据总个数去除。通常用比例或百分数表示。 概率又称机率、或然率,用符号P表示,指某一事件在无限的观测中所能预料的相对出现的次数,也就是某一事物或某种情况在某一总体中出现的比率。五、参数和统计量 总体的那些特征称为参数又称总体参数,是描述一个总体情况的统计指标。 样本的那
12、些特征值叫做统计量,又称特征值。 参数和统计量之间最明显的区别是参数常用希腊字母表示,而样本统计量则用英文字母表示。第1章 资料收集与整理第一节 数据的初步整理一、数据排序o 数据排序:按照某种标准,对收集到的杂乱无章的数据按照一定顺序进行排列。二、统计分组o 统计分组:根据被研究对象的特征,将所得数据划分到各个组别中去。(一)统计分组前的准备o 对数据进行核对和校验 n 消除记录误差:如写错小数点 n 谨慎处理极端值 n 三个标准差原则 (二)统计分组注意的问题1 、分组以研究对象的本质特性为基础 2 、分类标志要明确 (三)分组的标志分组的关键1、性质类别根据事物的属性不同,形成品质数列;
13、 2、数量类别以数据的取值大小为分类标志。数量界限必须反映各组质的差异,形成变量数列。三、统计表o 表号o 名称o 标目o 数字o 表注表号名称标目数字表注统计表的绘制原则总原则:(1)重点突出。不要包罗万象,要使人看过后能明白表格所要表达的主要内容。(2)层次分明。避免层次过多或结构混乱。四、统计图 统计图利用点的多少,线的长短,面积的大小,颜色的浓淡,线条的疏密或曲线的变化,来表示数据的大小程度、变动情况、分布状态和相依关系。 以形状为标准,可分为线形图、长条图、面积图、立体图等。统计图图号及图题,图目,图尺,图形,图例,图注统计表和统计图o 统计表和统计图是重要的统计描述方法。o 优点:
14、n 简单明了n 易于理解和接受n 便于比较和分析n 结果一目了然第二节 次数分布表一、简单次数分布表o 依据每一个数值在一列数据中出现的次数或总计数资料编制成的统计表。二、分组次数分布表(详细步骤及例题见书52页)(一)编制分组次数分布表的步骤n 1、求全距n 2、决定组距与组数n 3、列出分组区间n 4、登记次数n 5、计算次数(二)意义和缺点三、相对次数分布表四、累加次数分布表五、双列次数分布表六、不等距次数分布表第三节 次数分布图一、直方图二、次数多边形图三、累加次数分布图(一)累加直方图(二)累加曲线第四节 其他类型的统计图表一、其他常用的统计表类型(一)简单表(二)分组表(三)复合表
15、二、其他常用的统计图的类别(一)条形图(二)圆形图(三)线形图(四)散点图第二章 集中量数第一节 算术平均数n 算术平均数(arithmetic average),一般简称为平均数(average )或均数、均值(mean)。只有在与其他几种平均数,如几何平均数、调和平均数、加权平均数相区别的时候,才把它叫做算术平均数。平均数一般用M表示。如果平均数是由X变量计算的,就记为 (读作X杠),若由Y变量求得,则记为 。一、平均数的计算方法(一)未分组数据计算平均数的方法 当一组数据未进行统计分类时,若想描述其典型情况,找出其代表值,可计算算术平均数,公式为:(二)用估计平均数计算平均数(步骤见书6
16、6页) 数据的数目以及每个观测数据值(即数字)都很大时,利用估计平均数(an estimated mean)可以简化计算。二、平均数的特点1、在一组数据中每个变量与平均数之差(称为离均差)的总和等于0。3、在一组数据中,每一个数后乘以一个常数C所得的平均数为原来的平均数乘以常数C,即三、平均数的意义n 算术平均数是应用最普遍的一种集中量数。它是“真值”(true score)渐近、最佳的估计值。四、平均数的优缺点n 优点n 反应灵敏。观测数据中任何一个数值或大或小的变化,甚至细微的变化,在计算平均数时,都能反应出来。n 计算严密。计算平均数有确定的公式,不管何人在何种场合,只要是同一组观测数据
17、,计算的平均数都相同。n 计算简单。计算过程只是应用简单的四则运算。n 简明易解。平均数概念简单明了,较少数学抽象容易理解。n 适合于进一步用代数方法演算。在求解其他统计特征值,如离均差、方差、标准差的计算时,都要应用平均数。n 较少受抽样变动的影响。观测样本的大小或个体的变化,对计算平均数影响很小。在来自同一总体逐个样本的集中量数中,平均数的波动通常小于其他量数的波动,因此它总是最可靠、最正确的量数。n 缺点n 易受极端数据的影响。n 若出现模糊不清的数据时,无法计算平均数。五、计算和应用平均数的原则n 1、同质性原则n 只有在总体是由同类数据所组成且有足够多的数据单位时,平均数才具有科学价
18、值和认识意义。n 同质数据是指使用同一个观测手段,采用相同的观测标准,能反映某一问题的同一方面特质的数据。n 2、平均数与个体数值相结合的原则n 平均数反映客观事物的一般水平,但没有反映数据之间的差异,造成某些信息遗失。n 在运用平均数做统计分析时,还应与个体数值相结合。n 3、平均数与标准差、方差相结合原则n 平均数和标准差是用来描述数据总体特征的一对相互联系的统计指标。平均数反映的是总体数据的集中趋势。但平均数对于总体数据一般水平的代表性如何,要看各个数值之间差异的大小。n 各个数值之间差异大小是通过标准差和方差来描述的。标准差和方差反映总体的离中趋势,标准差越大,平均数的代表性就越小。第
19、二节 中数与众数一、中数n 中数(median),又称中点数、中位数、中值,符号为 Md 或 Mdn。中数是按顺序排列在一起的一组数据中居于中间位置的数,即在这组数据中,有一半的数据比它大,有一半的数据比它小。(一)未分组数据求中数的方法 根据中数的概念,首先将数据依其取值大小排序,然后找出位于中间的那个数,就是中数。1、一组数据中无重复值的情况 指一组数据中没有相同的数,这时取处于序列中间位置的那个数为中数。 (1)数据个数为奇数,则中数为 (N+1)/2 位置的那个数。 (2)数据个数为偶数,则中数为居于中间位置两个数的平均数,即第 N/2 与第 (N/2 +1) 位置的两个数据相加除以2
20、。n 2、一组数据中有重复数值的情况(计算重要)n 指一组数据中有相同数值的数据,这时计算中数的方法基本与无重复数值的单列数据相同。n (1)当重复数值没有位于数列中间时,求中数的方法与无重复数据时求中数的方法相同。n (2)当重复数目位于数列中间,数据的个数为奇数的情形。n (3)当重复数目位于数列中间,数据的个数为偶数的情形。(二)中数的优缺点与应用n 优点n 中数是根据观测数据计算而来,不能凭主观臆定。n 中数计算简单,容易理解,概念简单明白。n 缺点n 中数的计算不是每个数据都加入,其大小不受制于全体数据。n 反应不够灵敏,极端值的变化对中数不产生影响。n 受抽样影响较大,不如平均数稳
21、定。n 计算时需要对数据先排列大小。n 中数乘以总数与数据的总和不相等(中数等于平均数时例外)。n 不能作进一步代数运算。n 在一些特殊情况下,中数的应用受到重视。n 当一组观测结果中出现两个极端数目时。n 当次数分布的两端数据或个别数据不清楚时,只能取中数作为集中趋势的代表值。n 当需要快速估计一组数据的代表值时。二、众数n 众数(mode),又称为范数、密集数、通常数等,常用符号Mo表示,是指在次数分布中出现次数最多的那个数的数值。(一)计算众数的方法 1、直接观察求众数 2、用公式求众数 用公式计算的众数成为数理众数。一般在心理与教育统计中应用较多的是皮尔逊经验法和金氏插补法。(二)众数
22、的意义与应用n 优点n 众数的概念简单明了,容易理解。n 缺点n 众数不稳定,受分组和样本变动影响。n 计算时不需每一个数据都加入,因而较少受极端数目的影响,反应不够灵敏。n 用观察法得到的众数,不是经过严格计算而来,用公式计算所得众数也只是一个估计值。n 不能作进一步代数运算。总数乘以众数与数据的总和不相等。三、平均数、中数与众数三者之间的关系n 在正态分布中,平均数、中数、众数三者相等,在数轴上完全重合,此时只用报告平均数。n 在正偏态分布中,MMdMo n 在负偏态分布中,MMdMo n 皮尔逊认为, 2Mo=3Md- 2M第三节 其他集中量数(应用问题)一、加权平均数(MW)(例题见书
23、71页)n 计算公式:n 小组平均数计算总平均数二、几何平均数(Mg)(例题见书72页)(一)计算公式(二)几何平均数的应用1、直接应用基本公式计算几何平均数n 一组实验数据中有少数数据偏大或偏小,数据分布呈偏态。 n 心理物理学的等距量表实验中,只能用几何平均数。 2、应用几何平均数的变式计算n 一组数据彼此之间变异较大,几乎是按一定的比例关系变化。 n 学习方面的增加率 n 学生或人口增加率的估计 n 一些经费的增加率 三、调和平均数(MH)(例题见书73页)(一)计算公式(二)调和平均数的应用n 主要是用来描述学习速度方面的问题。第三章 差异量数引言 差异量数:对一组数据的变异性,即离中
24、趋势特点进行度量和描述的统计量,也称离散量数。 主要包括:全距、四分位差、平均差、标准差、方差等。第一节 全距和百分位差 一、全距(分组中的其中一步) 又称两极差,符号“R”。 计算公式:R=Xmax - Xmin 二、百分位差(具体见书81页 对位置量数) P10 与P90之间的距离。 (一)百分位的计算公式: (二)百分位数与百分等级三、四分位差 指一个次数分布中,中间50%的次数的全距的一半。在一组数据中,它的值等于P25 到P75距离的二分之一。 计算公式:第二节 平均差、方差与标准差 一、动差体系 二、平均差(例题见书76页) 是次数分布中所有原始数据与平均数绝对离差的平均值。 符号
25、:A.D.或 M.D. 计算公式:三、方差与标准差 (一)方差 也称变异数、均方。是每个数据与该组数据平均数之差平方后的均值,即离均差平方后的平均数。 是度量数据分散程度的重要统计量。符号:样本统计量:S2 总体统计量:2 方差计算公式 标准差 即方差的平方根,用符号S和表示 计算公式三、方差与标准差 直接使用原始分数计算方差与标准差。公式如下:三、方差与标准差 (二)计算分组数据的标准差与方差 (三)总标准差的合成 (四)方差与标准差的性质和意义 1、性质 方差是对一组数据的各种变异的总和的测量,具有可加性和可分解性。 标准差是一组数据方差的平方根,不能进行代数运算。具有以下特性: (1)每
26、一个观测值都加上一个常数后,计算后的标准差等于原标准差。 (2)每一个观测值都乘上一个常数后,计算后的标准差等于原标准差乘以这个常数。 (3)以上两点结合,每一个观测值都乘上一个常数A后,再加上一个常数B,计算后的标准差等于原标准差乘以常数A。三、方差与标准差 2、意义 值越大,说明次数分布的离散程度越大,数据较为分散;值越小,说明次数分布比较集中,离散度小。 标准差的特点: 反应灵敏;计算公式严密确定;容易计算;适合代数运算;受抽样变动较小;简单明了第三节 标准差的应用一、差异系数(例题见书79页) 又称变异系数,相对标准差等,是一种相对差异量。用CV表示,是标准差对平均数的百分比。 计算公
27、式: 适用范围:1、同一团体不同观测值离散程度的比较2、对于水平相差较大,但进行的是同一种观测的各种团体,进行观测值离散程度的比较。 注意问题:1、测量的数据要保证是等距尺度;2、观测工具应具备绝对零,如重量、长度;3、只能用于描述,不同进行推论。二、标准分数(例题见书84页 相对位置量数) 标准分数(standard score),又称基分数或Z分数(Z-score),是以标准差为单位表示一个原始分数在团体中所处位置的相对位置量数。 计算公式: 标准分数的性质1. Z 分数无实际单位,是以平均数为参照点,以标准差为单位的一个相对量。 2. 一组原始分数转换得到的Z 分数可以是正值,也可以是负
28、值。 3. 一组原始数据中,各个Z 分数的标准差为14. 若原始分数呈正态分布,则转换得到的所有Z 分数值的均值为0 ,标准差为1 的标准正态分布。 标准分数的优点可比性,可加性,明确性,稳定性 标准分数的应用(后文正态分布中有用) 比较几个分属性质不同的观测值在各自数据分布中相对位置的高低。 计算不同质的观测值的总和或平均值,以表示在团体中的相对位置。 表示标准测验分数。三、异常值的取舍 三个标准差法则:如果数据值落在平均数加减三个标准差之外,则在整理数据时,可将此数据作为异常值舍弃。第四节 差异量数的选用一、优良差异量数具备的标准二、各种差异量数优缺点比较三、各种差异量数之间的关系四、如何
29、选用差异量数第四章 概率与概率分布第一节 概率基本概念一、随机事件及其概率 确定现象 必然现象:日出日落 不可能现象:自然条件下,水向上流 随机现象 发票中奖 后验概率(或统计概率) 随机事件的频率先验概率(古典概率)古典概率模型要求满足两个条件: 试验的所有可能结果是有限的; 每一种可能结果出现的可能性相等。二、概率的加法定理 若事件发生,则事件就一定不发生,这样的两个事件为互不相容事件。 两互不相容事件和的概率,等于这两个事件概率之和,即三、概率的乘法定理 若事件发生不影响事件是否发生,这样的两个事件为互相独立事件。 两个互相独立事件积的概率,等于这两个事件概率的乘积,即 例1:某一学生从
30、个试题中任意抽取一题,进行口试。如果抽到每一题的概率为15,则抽到试题或试题的概率是多少? 如果前一个学生把抽过的试题还回后,后一个学生再抽,则个学生都抽到试题1的概率是多少? 计算 抽到第一题或第二题的概率应为抽到第一题的概率和抽到第二题的概率之和,即四个学生都抽到第一题即四个学生同时抽到第一题,其概率应为抽到第一题的概率的乘积,即 例2:从30个白球和20个黑球共50个球中随机抽取两次(放回抽样),问抽出一个黑球和一个白球的概率是多少? 抽出一个白球的概率为35,抽出一个黑球的概率为25。 抽出一个黑球和一个白球的情况应包括先抽出一个黑球、后抽出一个白球和先抽出一个白球、后抽出一个黑球两种
31、情况。因此:四、概率分布类型 概率分布(probability distribution)是指对随机变量取不同值时的概率的描述,一般用概率分布函数进行描述。 依不同的标准,对概率分布可作不同的分类。(一)离散型分布与连续型分布 依随机变量的类型,可将概率分布分为离散型概率分布与连续型概率分布。心理与教育统计学中最常用的离散型分布是二项分布,最常用的连续型分布是正态分布。 (二)经验分布与理论分布 依分布函数的来源,可将概率分布分为经验分布与理论分布。 经验分布是指根据观察或实验所获得的数据而编制的次数分布或相对频率分布。 理论分布是按某种数学模型计算出的概率分布。 (三)基本随机变量分布与抽样
32、分布 依所描述的数据的样本特性,可将概率分布分为基本随机变量分布与抽样分布。 基本随机变量分布是随机变量各种不同取值情况的概率分布 抽样分布是从同一总体内抽取的不同样本的统计量的概率分布。第二节 正态分布一、标准分数 标准分数(standard score),又称为基分数或分数(Zscore),是以标准差为单位表示一个原始分数在团体中所处位置的相对位置量数。 标准分数从分数对平均数的相对地位、该组分数的离中趋势两个方面来表示原始分数的地位。 1.标准分数的计算标准分数的计算公式为 分数可以表明原始分数在团体中的相对位置,因此称为相对位置量数。 把原始分数转换成分数,就把单位不等距的和缺乏明确参
33、照点的分数转换成以标准差为单位、以平均数为参照点的分数。 2.标准分数的性质 分数无实际单位,是以平均数为参照点、以标准差为单位的相对量。 一组原始分数得到的分数既有正值,也有负值,所有原始分数的分数之和为零。 一组原始数据中,各个分数的标准差为。 标准正态分布的平均值为,标准差为。二正态分布 正态分布(normal distribution)也称为常态分布,是连续型随机变量概率分布的一种,是在数理统计的理论与实际应用中占有最重要地位的一种理论分布。 正态分布于1733年发现的。拉普拉斯、高斯对正态分布的研究也做出了贡献,故有时称正态分布为高斯分布。 1正态分布曲线函数正态分布曲线函数又称概率
34、密度函数,其一般公式为2标准正态分布曲线将标准分数代入正态曲线函数并且,令1则公式变换为标准正态分布函数: 以为横坐标,以为纵坐标,可绘制标准正态分布曲线。 标准正态分布曲线的纵线高度为概率密度,曲线下的面积为概率。3标准正态分布曲线的特点 曲线在处达到最高点 曲线以处为中心,双侧对称 曲线从最高点向左右缓慢下降,向两侧无限延伸,但永不与基线相交。 标准正态分布曲线的平均数为,标准差为。从3至3之间几乎分布着全部数据。 曲线的拐点为正负一个标准差处。三正态曲线表的编制1正态曲线表 利用积分公式可求出正态曲线下任何区间的面积,但需要计算,非常麻烦。 统计学家已编制好了正态分布表,使其使用非常方便
35、。 正态分布表的特点: 表中仅列有标准正态曲线下的面积,因此,查表前应先将原始变量转换为。2已知Z值求概率求0至某一值之间的概率:直接查表求两个值之间的概率 两值符号相同:PZ1Z2PZ2PZ1 两值符号相反:PZ1Z2PZ2PZ1求某一Z值以上的概率 Z0时,PZ0.5PZ Z0时,PZ0.5PZ求某一Z值以下的概率 Z0时,PZ0.5PZ Z0时,PZ0.5PZ3已知面积(概率)求Z值求Z0以上或以下某一面积对应的Z值:直接查表求与正态曲线上端或下端某一面积P相对应的Z值:先用0.5PZ,再查表求与正态曲线下中央部位某一面积相对应的Z值:先计算P2,再查表已知概率或Z值,求概率密度Y 直接
36、查正态分布表就能得到相应的概率密度值。 如果由概率求值,要注意区分已知概率是位于正态曲线的中间部分,还是两尾端部分,才能通过查表求得正确的概率密度。四正态分布在测验上的应用(计算重点 例题见书110)(一)化等级评定为测量数据(二)确定测验题目的难易度(三)能力分组或等级评定时确定人数第三节 二项分布 二项分布(bionimal distribution)是一种具有广泛用途的离散型随机变量的概率分布又称为贝努里分布。一、二项试验与二项分布(一)二项试验满足以下条件的试验称为二项试验: 一次试验只有两种结果 ,即成功和失败; 共有n 次试验,n 是预先给定的任一正整数; 各次试验相互独立 ,即各
37、次试验之间互不影响; 某一结果出现的概率在任何一次试验中都是固定的。 (二)二项分布 二项分布是指统计变量中只有性质不同的两项群体的概率分布。 两项群体是按两种不同性质划分的统计变量,是二项试验的结果。 各项变量都可归为两个不同性质中的一个,两个观测值是对立的。(二)二项分布的平均数和标准差二项分布的平均数为二项分布的标准差为三、二项分布的应用 二项分布函数除了用来求成功事件恰好出现X次的概率之外,在心理学研究中主要用来判断试验结果的机遇性与真实性的界限。 例如,一个学生凭猜测做10个是非题,平均可以猜对5题。什么情况下可以说他是真会而不是猜测呢? 这种问题需要用累积概率来算。当做对题或题以上
38、时,累积概率为0.989,也就是说,猜对题或10题的概率不足0.05。 一个学生做10个正误题做对不同题数的概率分布(具体见书117页) 例题:一个教师对8个学生的作业成绩进行猜测,如果教师猜对的可能性为13,问: 平均能猜对几个学生的成绩? 假如规定猜对95,才算这个教师有一定的评判能力,那么这个教师至少要猜对几个学生?第四节 样本分布(有多个提取的样本的平均数组成的分布)一、正态分布及渐进正态分布(一)总体正态分布,方差已知,样本平均数分布为正态分布 平均数 标准误 (二)总体非正态分布,方差已知,当样本足够大时(n30),样本平均数分布为渐进正态分布 平均数 标准误 t分布是一种随机变量
39、函数的分布,高赛特于1908年推导出来。 t分布峰态比较高狭,分布形状随自由度变化而变化的一族分布。 t 分布与(n-1)有关。 (n-1)是t分布的自由度,用df表示。 自由度是指任何变量中可以自由变化的数目,代表t分布中独立随机变量的数目。t分布表(P358) t分布表由三部分构成: t值、自由度、显著性水平 左列为自由度,最上一行是不同自由度下t分布两尾端的概率(p值),指某一t值时,t分布两尾部概率之和,即双侧界限。表的最下一行是单侧界限,即从t值以下t分布一侧尾部的概率值。 双侧概率通常写作t(/2),单侧概率通常写作t。 当总体分布为正态,方差未知时,样本平均数的分布为t分布。总体
40、分布为非正态而方差又未知时,若满足n30这一条件,样本平均数的分布近似为t分布。第五章 参数估计参数估计在统计方法中的地位统计推断的过程第一节 点估计一、点估计的定义 点估计使用样本统计量来估计总体参数,因为样本统计量为数轴上某一点值,统计的结果也以一个点的数值表示,所以称为点估计。 当已知一个样本的观测值时,就可得到总体参数的估计值。点估计的优点在于它能够提供总体参数的估计值。二、良好估计量的标准1. 无偏性 用统计量估计总体参数一定会有误差,不可能恰恰相同。一个优秀的总体参数的估计值,应该具备无偏性。2. 一致性当样本容量无限增大时,估计值应能够越来越接近它所估计的总体参数,估计值越来越精
41、确,逐渐趋近于真值。3. 有效性 当总体参数的无偏估计不止一个统计量时,无偏估计变异小者有效性高,变异大者有效性低,即方差越小越好。第二节 区间估计区间估计的定义 区间估计:用一个区间去估计未知参数。 区间估计就是根据估计量以一定可靠程度推断总体参数所在的区间范围,它是用数轴上的一段距离表示未知参数可能落入的范围。置信区间与显著性水平 置信区间,也称置信间距,是指在某一置信度时,总体参数所在的区域距离或区域长度。 置信区间的上下二端点值称为置信界限。 置信概率是指估计总体参数落在某一区间时的概率,用符号1-a表示。 aa称为显著性水平,指估计总体参数落在某一区间时的可能犯错误的概率。区间与置信
42、水平 落在总体平均数某一区间内的样本一、 总体平均数的区间估计(一)总体正态、方差已知,对总体平均数的估计 当总体分布为正态,总体方差已知时,样本平均数的分布为正态分布。(二)总体正态、方差未知,对总体平均数的估计 当总体分布为正态,总体方差未知时,样本平均数的分布为t分布。(三)总体非正态,对总体平均数的估计 1、当总体分布为非正态,总体方差已知时,样本平均数的分布为渐进正态分布。 2、当总体分布为非正态,总体方差未知时,样本平均数的分布为近似t分布。(四)估计总体平均数的步骤1、根据样本数据,计算样本平均数与标准差。2、计算标准误。有两种情况。 总体方差已知 总体方差未知3、确定置信水平或
43、显著性水平4、根据样本平均数的抽样分布,确定查何种统计表。5、计算置信区间。6、解释总体平均数的置信区间。二、总体方差的区间估计 从正态分布的总体中随机抽取容量为n的样本,其样本方差与总体方差的比值的分布为卡方分布第六章 假设检验假设检验在统计方法中的地位统计方法描述统计推断统计参数估计第一节 假设检验的原理 研究假设(科学假设)H1: 进行研究时,根据已有理论和经验事先对研究结果做出一种预想的希望证实的假设。 虚无假设 H0: 与研究假设相对立,是直接被检验的假设。(二)什么是假设检验? 事先对总体参数或分布形式作出某种假设 然后利用样本信息来判断虚无假设是否成立 特点: 采用逻辑上的反证法 依据统计上的小概率原理假设检验中的小概率原理什么是小概率?1.在一次试验中,一个几乎不可能发生的事件发生的概率2.在一次试验中小概率事件一旦发生,我们就有理由拒绝虚无假设3.小概率由研究者事先确定假设检验的步骤 提出研究假设和虚无假设 确定适当的检验统计量 规定显著性水平 计算
链接地址:https://www.31ppt.com/p-4542102.html