自学考试《教育统计》总复习课件.ppt
教育统计与测量评价,课程安排,教育统计(1天半)教育测量(1天半)回顾、梳理知识结构,讲评真题、估计今年考试可能的考点(1天),学习建议,学习重点是掌握各种统计方法的适用范围、条件,而不是识记统计计算公式。把握教育统计与测量的整体知识结构、框架以及知识点之间的联系,第一章:教育统计概论,教育统计的含义教育统计的主要研究内容,统计的含义,统计(statistics)是关于数据的收集、整理、描述和推断(以获得有关研究对象特征及规律)的一种方法论学科,是教育学、心理学定量研究的主要方法。统计(statistic)statistics,意思是统计资料;statistic,意思是统计学;统计学起源于国情调查,最早意为国情学。教育统计学属于统计学中应用统计学的分支,是数理统计与教育学、心理学的交叉学科。,教育统计学知识结构,描述统计(descriptive statistics):描述数据全貌,表达事物的性质集中量数差异量数地位量数相关分析推断统计(inferential statistics):局部数据信息推断总体情形抽样分布假设检验参数检验非参数检验实验设计(experimental design)方差分析回归分析(不在考试范围)因子分析(不在考试范围),第二章:数据分布的初步整理,数据、变量的含义数据类型次数分布的概念及其图表常用统计图表,变量与数据,变量(variable):研究对象的某种特征,在个体之间可以变化。通常是描述个体某方面特征的概念,如学生性别、视力、自尊等变量值(value):变量在个体上的取值数据(data):用数量或数字形式表示的资料事实,在教育与心理研究中,主要通过调查、测量、实验等方式获得数据。,数据类型,从数据的观测方法和来源划分:计数数据(count data)测量数据(measurement data)数据反映的测量水平(考试重点):称名数据(nominal data)顺序数据(ordinal data)等距数据(interval data)等比数据(ratio data)数据是否具有连续性:离散数据(discrete data)连续数据(continuous data),次数分布,概念:一批数据中各个不同数据所出现次数多少的情况,或者是这批数据在数轴上各个区间内所出现的次数多少的情况。简单次数分布表:反映一批数据在各等距区组内的次数分布结构。相对次数分布表:反映各组数据的百分比结构相对次数:各组次数f与总次数N之间的比值。累积次数分布表:处于某个数值以下的数据个数的数量。,次数分布图,次数直方图:由若干高度相等、高度不一的直方条紧密排列在同一基线上构成的图形。横轴和纵轴的意义每一直方条的宽度(组距i)次数多边图:利用闭合的折线构成多边形以反映次数变化情况的一种图示方法。次数分布曲线:若总次数无限增大,则随着组距的缩小,这些折线所接近的极限便将成为极光滑而富有规律的曲线,称为次数分布曲线。,练习,表中描述的变量是什么?参加英语考试的总人数为多少?在分组归类统计数据中,测验数据各划分成几组?在数据分组归类时,各组的实际组限是怎样确定的?各组的组距是多少呢?,常用统计图,散点图:两事物之间的相关性及联系模式线性图:某种事物的发展变化及演变趋势,某种事物在时间上序列上的变化趋势一种事物随另一事物发展变化的趋势比较不同人物团体在同一心理或教育现象上的变化特征及相互联系条型图:通常用于刻画离散型变量,与直方图不同圆形图:单位圆内各扇形面积占整个圆形面积的百分比。各统计事项在总体中所占的比例,本章课后习题练习,第三章:次数分布的特征量数,集中量数平均数算数平均数加权平均数中数众数差异量数平均差方差与标准差差异系数地位量数百分等级,次数分布的特征量数,统计学的两个追求:简洁精确次数分布表能够准确反映了数据的整体形态和结构,但是不够简洁有时需要用更加凝练、准确地概括的数量来描述、使用这批数据,那么该怎么办呢?集中量数差异量数,集中量数,概念:反映数据集中趋势的量数。集中趋势是指数据分布中大量数据向某方向集中的程度。集中量数的作用:提供整个分布中多数数据的集结点位置集中反映一批数据在整体上的数量大小是一批数据的典型代表值,集中量数,平均值(mean):样本中变量值的算术平均中位数(median):将变量值从小到大排列,位于正中的那个值众数(mode):样本中变量取值次数最多的那个数值,平均数,算数平均数公式:加权平均数适用情境:构成总体的各因素有不同的重要程度。在分组数据和由各小组平均数来计算总平均数的时候。公式:,平均数性质,离均差总和为零(观测值与平均数离差的总和为零)每一个观测值都加上一个相同常数c后,计算得到的平均数等于原平均数加上这个常数c每一个观测值都乘以一个相同的非零常数c 后,计算得到的平均数等于原平均数乘以这个非零常数c每一个观测值都乘以一个相同非零常数c,再加上一个常数d后,计算得到的平均数等于原平均数乘以该非零常数c再加上常数d,平均数的优缺点,算术平均数是应用最普遍的一种集中量数,它是“真值”(true score)渐进、最佳的估计值。优点:反应灵敏;计算严密;计算简单;简明易解;适合于进一步用代数方法演算;较少的受样本变动的影响缺点:易受极端数据的影响当个别数据模糊不清时,无法准确计算数据不同质时,应用时需要注意方法的选择,中位数,概念:位于数据分布正中间位置上的那个数中位数的优缺点:优点:计算简单;不受极端数据影响;许多顺序变量也较适用中数作为分布的集中量数缺点:反应不灵敏,代表性差,抽样影响大;中数一般不适用于进一步代数运算,众数,概念:样本中变量取值次数最多的那个数值优缺点:概念简单明了,容易理解,但不稳定,受分组影响,亦受样本变动影响计算时不需每个数据都加入,较少受极端数目的影响,反应不够灵敏。用观察法得到的众数是估计值,不能作进一步代数运算。不是一个优良的集中量数,应用不广泛。,平均数、中数与众数比较,平均数、中数与众数三者之间关系,在正态分布中三者相等在正偏态分布时,MMdMo在负偏态分布时,MMdMo皮尔逊经验法:Mo=3Md-2M,差异量数,三组数据:A:7,7,8,8,8,9,9 B:4,5,7,8,9,11,12 C:1,4,7,8,9,12,15 概念:数据具有偏离中心位置的趋势,反映了一组数据本身的离散程度和变异性程度。作用:大体判断一组数据与其中心位置的平均差异程度比较两组数据的离散程度差异量数大,集中量数的代表性差;反之,差异量数小,集中量数代表性强种类:全距:R=最大值-最小值平均差方差与标准差,平均差,概念:次数分布中所有原始数据与平均数绝对离差的平均值。公式:,平均差的优缺点,平均差是根据分布中每一个观测值计算求得的,它比较好地度量了次数分布的离散程度。平均差的计算要取绝对值。但不利于进一步的统计分析,故在统计实践中平均差不常使用。,方差与标准差,概念:方差:(variance),又称变异数,均方(mean square),指离均差平方的和的平均。总体方差表示为s,样本方差表示为。标准差:(standard variance),指方差的平方根。总体标准差表示为,样本标准差表示为S或SD。,方差与标准差,公式:总体样本,方差与标准差的性质,方差具有可加性,可分解性。是统计推论中最常用的统计特征数。标准差:全组数据每一观测值都加上一个相同的常数c后,计算得到的标准差不变若每一观测值都乘以一个相同的非零常数c,则所得的标准差等于原标准差乘以这个常数的绝对值若每一观测值都乘以一个相同的非零常数c,再加上一个常数d,计算得到的标准差不变,差异系数,概念:将差异量数与集中量数相对比后所形成的相对差异量数。公式:适用情境:两个或两个以上样本所测的特质不同两个或两个以上样本所测的特质相同,但样本间的水平相差较大,地位量数,概念:研究对象某一属性的数量化指标,即原始变量在其所处分布中地位的量数百分等级(PR)反映的是某个观测分数以下数据个数占总个数的比例的百分数,在 0到100之间取值。百分位数:位于特定百分等级位置上的一个数,它是次数分布中或量尺上的一个数。正态分布中的百分等级,本章课后习题练习,第四章:相关分析,集中量数和差异量数主要用于描述单变量数据资料,相关系数则用于描述双变量数据相互之间的关系。事物之间关系:因果关系:两类现象之间存在明确的条件与结果之间的关系。共变关系:表面上看来有联系的两事物都与第三种有关。相关关系:两类现象在发展变化的方向与大小方面确实存在一定的联系,但又不是因果或共变关系时,称这种关系为相关关系,在统计学中相关有时被解释为两种特征相伴随的变化。相关方向:正相关:变量之间变动方向相同,同增同减,0r1;负相关:变量之间变动方向相反,一个增加,另一个则变小,-1r0;零相关:变量之间的变动完全没有规律可循,r=0。,相关系数及其解释,概念:相关系数(coefficient of correlation)是两列变量间相关程度的数量化指标。解释:相关系数的大小(绝对值)表示两类数据的密切程度。正号表示正相关,负号表示负相关当r=+1.00时,表示完全正相关;当r=-1.00时,表示完全负相关;当r=0时,表示几乎没有联系r0.7高相关;0.40.7之间中等相关;0.4之下低相关相关系数仅仅是一个比值,不是等距的,也不是百分比,因此不能进行四则运算,也不能用倍数关系表示,正、负号仅表示方向有相关关系不一定是因果关系散点图,常用相关关系与计算,积差相关等级相关点双列相关,积差相关,皮尔逊积差相关公式:适用情境:成对的数据,N30对两个变量的总体都呈正态分布(即正态双变量),或接近正态分布,至少是单峰对称分布,当然样本并不一定要正态两个变量都是由测量获得的连续性数据,即等距或等比数据两个变量之间呈线性关系,等级相关,公式:两列等级顺序数据或非正态等距、等比数据样本容量不做限制,n30也可以。,点双列相关,公式:p是二分类数据中某类事物所占的比例q是二分类数据中另一类事物所占的比例适用情境:一列来自正态总体的等距或等比的测量数据另一列变量为二分称名变量。,课后练习题,第五章:随机变量、概率分布与抽样分布,随机变量与概率分布随机变量概率分布正态分布总体、样本与抽样方法总体与样本随机抽样方法简单随机抽样分层抽样分阶段抽样等距抽样样本平均数的抽样分布抽样分布平均数的抽样分布,随机现象与概率分布,确定性现象:在相同条件下其结果也一定相同的现象例如,水加热至100摄氏度变成水蒸气不确定性现象:在相同条件下其结果却不一定相同的现象,也称随机现象例如,掷硬币,教育与心理现象(考试成绩)随机现象常被称为随机试验,随机试验的各种可能性结果称作为事件,记作事件A、事件B等等例如,随机事件A为“掷硬币结果正面向上”,随机事件B为“掷硬币结果正面向下”概率:某事件发生的概率就是该事件发生的可能性大小,取值范围在01之间概率分布:随机变量所有取值点的概率分布情况离散型变量 vs 连续性变量,正态分布,正态分布:也称常态分布或常态分配,是连续随机变量概率分布的一种,是在数理统计的理论与实际应用中占有最重要地位的一种理论分布中间大,两端小,单峰对称,钟形正态分布是概率论中最重要的一种分布:正态分布是自然界最常见的一种分布正态分布具有许多良好的性质,许多分布可用正态分布来近似,另外一些分布又可以通过正态分布来导出推断统计的总体基本上都要求服从正态分布正态分布形成原因:影响一个随机变量取值的因素很多,而在这些因素中又没有那个因素起决定作用,那么这个随机变量最终就能形成正态分布例如,学习成绩,正态分布图像,标准正态分布,公式:平均数为0,标准差为1,标准正态分布下标准差与概率的关系,总体、样本与抽样方法,总体(population):研究对象的全体样本(sample):样品全体样品(case):被抽到的个体。心理和教育研究通常称为被试(subject)样本容量(sample size):样品个数总体参数样本统计量推断统计的任务:样本统计量总体统计量,抽样方法,获得代表性的样本需要科学的抽样方法科学的抽样方法:简单随机抽样分层抽样分阶段抽样等距抽样,简单随机抽样,概念:从某一特定总体中抽取样本时,总体中每一个元素(或个体)被抽取的可能性是同等的,而且任何元素(或个体)之间彼此被抽取的机会是相互独立的一种抽样方法。原则:机会均等相互独立举例:彩票常用的方法:抽签法随机数表,分层抽样,概念:按照总体已有的某些特征,将总体分成几个不同的部分,每一部分称为一个层在每一层中实行简单随机抽样原则:层内样本变异小,层间变异尽可能大步骤:按比例求出各部分入样元素数各部分按需要的入样用简单随机抽样的方法产生入样元素,分阶段抽样,概念:分阶段抽样实际上进行两次抽样,第一次以“部分”为元素进行抽样,然后再在入样的这些部分中抽取入样元素例子:书上p221,等距抽样,概念:等距抽样第一步是对总体所有元素编号,第二步计算没相邻入样元素编号,第三步是在第一间隔中随机确定第一个入样元素的号码,第四步则开始抽取入样元素。适用情境:总体很大,样本较小,总体无中间层次结构的抽样。原则:编号元素的性质不能出现规律性变化,抽样分布,概念:从一个总体中随机抽取若干个等容量的样本,计算每个样本的某个特征量数(如,平均数、标准差),由这些特征量数形成的分布,称为这个特征量数的抽样分布。抽样分布就是样本统计量的取值分布举例:书中p222,平均数的抽样分布,(1)总体分布为正态,总体方差已知,样本平均数的分布为正态分布与母总体分布的图像比较(样本:高狭),平均数的抽样分布,(2)原总体正态、总体方差未知情况下的平均数抽样分布平均数的抽样分布服从一个自由度为n-1的t分布,这个t分布的平均数就是原总体平均数,这个t分布的标准差,也就是平均数的抽样标准误等于样本标准差(n-1)分之一,即,SEX=S/(n-1)t分布与正态分布一样,也是一个单峰对称呈钟形的分布,其对称轴通过分布的平均数,t分布曲线在正负两个方向上也以横轴为它的渐近线。t分布是一簇分布,每一个t分布的形态受自由度制约。,t分布图像,平均数的抽样分布,(3)原总体非正态,但样本较大情况下的平均数抽样分布总体方差未知,平均数的标准误:总体方差未知,平均数的标准误:,课后习题,第六章:参数差异显著性检验,小概率原理假设检验统计假设检验的几个基本概念统计假设检验的基本思想统计假设检验的基本步骤统计决策的两类错误单侧检验与双侧检验平均数差异检验的显著性检验其他总体参数的差异显著性检验,小概率原理,暗箱里有95个红球,5个白球,随机抽出一个球,让你猜是红球还是白球?反过来,有人告诉你,口袋中有95个红球,5个白球。但是你从袋中抽出一粒白球,这时你认为,之前告诉你的事实是真的还是假的呢?小概率原理:认为小概率事件在一次抽样中可能发生的原理,假设及假设检验,假设(hypothesis):根据已知理论或事实对研究对象所做的假定性说明。统计学中的假设一般专指用统计学术语对总体参数所做的假定性说明。假设与问题不同。假设必须进行验证才能承认或否认它。检验的方法是进行实验或调查,然后再进行统计。举例:假设:男生的智力水平高(低)于女生问题:性别与智力的关系,统计中的假设检验,统计假设中的两种假设虚无假设(null hypothesis):无差假设、零假设、原假设,记为H0。它总作为直接被检验的假设。通常将虚无假设为相等,以方便统计检验备择假设(alternative hypothesis):对立假设,记为H1。虚无假设与备择假设互相排斥且只有一个正确。虚无假设是统计推论的出发点。,假设检验,概念:在统计学中,通过样本统计量得出的差异作出作出一般性结论,判断总体参数之间是否存在差异,这种推论过程称作假设检验。假设检验分为参数检验和非参数检验:若进行假设检验时,总体的分布形式已知,需要对总体的未知参数进行假设检验,称其为参数假设检验(parametric test)。若对总体分布形式所知甚少,需要对未知分布函数的形式及其他特征进行假设检验,通常称之为非参数假设检验(non-parametric test)。,统计假设检验的步骤,根据题目的设问提出检验假设选定显著性水平根据检验目的和已知条件找到相应的抽样分布写出检验统计量计算公式并按已知数据条件计算检验统计量值根据显著性水平在抽样分布中确定临界值和危机域将求得的检验统计量值与临界值做比较,根据其是否进入危机域而作出是否拒绝虚无假设的统计结论,假设检验中的两类错误,型错误(type error)和型错误(type error)总体的真实情况往往是未知的,根据样本推断总体,有可能犯两类错误虚无假设本来是正确的,但拒绝了,这类错误称为弃真错误,即型错误。虚无假设本来不正确但却接受了,这类错误称为取伪错误,即型错误。,影响型错误的影响因素,客观的真值与假设的伪值两者之间的差异值的大小越大,型错误就越小越小,型错误就越大样本容量控制降低犯型错误的方法:增大样本容量,假设检验中的两种检验方法,双侧检验如果检验目的是为了判断某个总体参数是否等于某个固定值,或者为了推断某两个总体参数是否相等,则应该使用双侧检验双侧检验在抽样分布的两尾侧各有一个临界值单侧检验如果检验的目的是为了推断某个总体参数是否大于或小于某个定值,或者为了推断某两个总体参数之间有无大于或小于的关系,则应该使用单侧检验单侧检验在抽样分布的一侧只有一个临界值,面积等于显著性水平,总体平均数差异的显著性检验,主要用途:检验两个总体的平均数是否相等检验是否一组平均数大于或小于另一个平均数检验两个总体的样本平均数 的抽样分布 的抽样分布主要受四个因素的影响:两个总体是否相关两个总体的分布是否正态的影响两个总体的方差是否已知以及是否相等的影响样本容量,总体平均数差异的显著性检验,由样本平均数差异 检验总体平均数差异如何区分相关样本与独立样本两列数据是否来自同一批实验对象两列数据是否是经过严格匹配的数据,具体应用,(1)总体方差已知、两独立正态总体的平均数差异显著性检验,具体应用,(2)总体方差相等但未知数值的两独立正态总体平均数差异显著性检验t检验,具体应用,(3)两相关样本总体差异显著性检验,具体应用,(4)两独立总体大样本平均数差异显著性检验用样本方差作为估计值使用Z检验四种具体应用中第2种是重点,最经常使用的情况,考试的可能性最大,两独立总体方差差异显著性检验,主要应用:方差齐性检验方差分析两独立正态总体方差差异检验的样本数据是两个样本方差,服从F分布的理论分布,相关系数的显著性检验,总体相关显著性检验:检验假设:H0:=0H1:0公式:两独立总体极差相关系数差异显著性检验:检验假设:H0:1=2 H1:1 2Zr 转化法,课后习题,第七章:2检验,2检验基本原理总体分布拟合良度检验独立性检验,2检验,概念:2是检验实际观测次数与理论期望次数之间差异程度的指标公式:书p265主要用途:某抽样观测数据的分布是否与某一理论分布相一致两个分类特征之间是彼此相关还是相互独立的问题,总体分布的拟合良度检验,概念:解决问题:从实际抽样调查所得的观测数据,来推断其所来自的总体的次数分布是否服从理论上所假定的某一概率分布方法:借助2统计量的值来考察实际观测次数f0与某一假定分布的理论次数fe之间的差异是否显著例题:书中例题,独立性检验,概念:解决问题:事物分成两个特征,检验双向分类数据中两个分类特征(变量)之间是独立无关还是相关公式:例题,课后习题,第八章:方差分析,方差分析基本原理方差分析目的方差分析原理与前提假设单因素方差分析方法单因素方差分析步骤事后多重比较,方差分析,概念:方差分析又称变异数分析,是一种应用非常广泛的统计方法。主要功能在于分析实验数据中不同来源的变异对总变异的贡献大小,从而确定实验中因素对反应变量是否存在显著影响。主要应用:两种以上实验处理的数据分析比较两个以上的样本平均数,变异来源,总变异=组间变异+组内变异总变异:把所有被试的数值作为一个整体考虑时得到的结果,是用所有被试的因变量的值计算得到的。组间变异:由于不同实验组的实验处理不同造成的。可以用两个平均数之间的离差表示。组内变异:由组内各被试因变量的差异范围决定的。由于实验中一些希望加以控制的非实验因素和一些未被有效控制的未知因素造成的变异全被认为是误差因素。,方差分析的基本假设,方差可加性总体正态分布样本随机性方差齐性,方差分析的方差齐性检验,Hartley最大F比率法找出比较的几个组内方差的最大值与最小值,代入公式公式:查Hartley方差齐性检验临界值表统计决策,方差分析的基本过程与步骤,建立假设虚无假设备择假设计算平方和、自由度与均方进行F检验计算F值查表求得临界值F检验决断列出方差分析表,逐对平均数差异检验方法,方差分析F检验结果若接受虚无假设,表明实验中处理效应为零假设检验结束若拒绝虚无假设,则表明实验中至少有两个处理的总体平均数不等需要对k个处理的平均数进行比较2个以上的平均数不能使用平均数差异显著性检验方法不能对2个以上的平均数反复进行t检验增大错误,