自学考试《教育统计》总复习课件.ppt
《自学考试《教育统计》总复习课件.ppt》由会员分享,可在线阅读,更多相关《自学考试《教育统计》总复习课件.ppt(90页珍藏版)》请在三一办公上搜索。
1、教育统计与测量评价,课程安排,教育统计(1天半)教育测量(1天半)回顾、梳理知识结构,讲评真题、估计今年考试可能的考点(1天),学习建议,学习重点是掌握各种统计方法的适用范围、条件,而不是识记统计计算公式。把握教育统计与测量的整体知识结构、框架以及知识点之间的联系,第一章:教育统计概论,教育统计的含义教育统计的主要研究内容,统计的含义,统计(statistics)是关于数据的收集、整理、描述和推断(以获得有关研究对象特征及规律)的一种方法论学科,是教育学、心理学定量研究的主要方法。统计(statistic)statistics,意思是统计资料;statistic,意思是统计学;统计学起源于国情
2、调查,最早意为国情学。教育统计学属于统计学中应用统计学的分支,是数理统计与教育学、心理学的交叉学科。,教育统计学知识结构,描述统计(descriptive statistics):描述数据全貌,表达事物的性质集中量数差异量数地位量数相关分析推断统计(inferential statistics):局部数据信息推断总体情形抽样分布假设检验参数检验非参数检验实验设计(experimental design)方差分析回归分析(不在考试范围)因子分析(不在考试范围),第二章:数据分布的初步整理,数据、变量的含义数据类型次数分布的概念及其图表常用统计图表,变量与数据,变量(variable):研究对象的
3、某种特征,在个体之间可以变化。通常是描述个体某方面特征的概念,如学生性别、视力、自尊等变量值(value):变量在个体上的取值数据(data):用数量或数字形式表示的资料事实,在教育与心理研究中,主要通过调查、测量、实验等方式获得数据。,数据类型,从数据的观测方法和来源划分:计数数据(count data)测量数据(measurement data)数据反映的测量水平(考试重点):称名数据(nominal data)顺序数据(ordinal data)等距数据(interval data)等比数据(ratio data)数据是否具有连续性:离散数据(discrete data)连续数据(con
4、tinuous data),次数分布,概念:一批数据中各个不同数据所出现次数多少的情况,或者是这批数据在数轴上各个区间内所出现的次数多少的情况。简单次数分布表:反映一批数据在各等距区组内的次数分布结构。相对次数分布表:反映各组数据的百分比结构相对次数:各组次数f与总次数N之间的比值。累积次数分布表:处于某个数值以下的数据个数的数量。,次数分布图,次数直方图:由若干高度相等、高度不一的直方条紧密排列在同一基线上构成的图形。横轴和纵轴的意义每一直方条的宽度(组距i)次数多边图:利用闭合的折线构成多边形以反映次数变化情况的一种图示方法。次数分布曲线:若总次数无限增大,则随着组距的缩小,这些折线所接近
5、的极限便将成为极光滑而富有规律的曲线,称为次数分布曲线。,练习,表中描述的变量是什么?参加英语考试的总人数为多少?在分组归类统计数据中,测验数据各划分成几组?在数据分组归类时,各组的实际组限是怎样确定的?各组的组距是多少呢?,常用统计图,散点图:两事物之间的相关性及联系模式线性图:某种事物的发展变化及演变趋势,某种事物在时间上序列上的变化趋势一种事物随另一事物发展变化的趋势比较不同人物团体在同一心理或教育现象上的变化特征及相互联系条型图:通常用于刻画离散型变量,与直方图不同圆形图:单位圆内各扇形面积占整个圆形面积的百分比。各统计事项在总体中所占的比例,本章课后习题练习,第三章:次数分布的特征量
6、数,集中量数平均数算数平均数加权平均数中数众数差异量数平均差方差与标准差差异系数地位量数百分等级,次数分布的特征量数,统计学的两个追求:简洁精确次数分布表能够准确反映了数据的整体形态和结构,但是不够简洁有时需要用更加凝练、准确地概括的数量来描述、使用这批数据,那么该怎么办呢?集中量数差异量数,集中量数,概念:反映数据集中趋势的量数。集中趋势是指数据分布中大量数据向某方向集中的程度。集中量数的作用:提供整个分布中多数数据的集结点位置集中反映一批数据在整体上的数量大小是一批数据的典型代表值,集中量数,平均值(mean):样本中变量值的算术平均中位数(median):将变量值从小到大排列,位于正中的
7、那个值众数(mode):样本中变量取值次数最多的那个数值,平均数,算数平均数公式:加权平均数适用情境:构成总体的各因素有不同的重要程度。在分组数据和由各小组平均数来计算总平均数的时候。公式:,平均数性质,离均差总和为零(观测值与平均数离差的总和为零)每一个观测值都加上一个相同常数c后,计算得到的平均数等于原平均数加上这个常数c每一个观测值都乘以一个相同的非零常数c 后,计算得到的平均数等于原平均数乘以这个非零常数c每一个观测值都乘以一个相同非零常数c,再加上一个常数d后,计算得到的平均数等于原平均数乘以该非零常数c再加上常数d,平均数的优缺点,算术平均数是应用最普遍的一种集中量数,它是“真值”
8、(true score)渐进、最佳的估计值。优点:反应灵敏;计算严密;计算简单;简明易解;适合于进一步用代数方法演算;较少的受样本变动的影响缺点:易受极端数据的影响当个别数据模糊不清时,无法准确计算数据不同质时,应用时需要注意方法的选择,中位数,概念:位于数据分布正中间位置上的那个数中位数的优缺点:优点:计算简单;不受极端数据影响;许多顺序变量也较适用中数作为分布的集中量数缺点:反应不灵敏,代表性差,抽样影响大;中数一般不适用于进一步代数运算,众数,概念:样本中变量取值次数最多的那个数值优缺点:概念简单明了,容易理解,但不稳定,受分组影响,亦受样本变动影响计算时不需每个数据都加入,较少受极端数
9、目的影响,反应不够灵敏。用观察法得到的众数是估计值,不能作进一步代数运算。不是一个优良的集中量数,应用不广泛。,平均数、中数与众数比较,平均数、中数与众数三者之间关系,在正态分布中三者相等在正偏态分布时,MMdMo在负偏态分布时,MMdMo皮尔逊经验法:Mo=3Md-2M,差异量数,三组数据:A:7,7,8,8,8,9,9 B:4,5,7,8,9,11,12 C:1,4,7,8,9,12,15 概念:数据具有偏离中心位置的趋势,反映了一组数据本身的离散程度和变异性程度。作用:大体判断一组数据与其中心位置的平均差异程度比较两组数据的离散程度差异量数大,集中量数的代表性差;反之,差异量数小,集中量
10、数代表性强种类:全距:R=最大值-最小值平均差方差与标准差,平均差,概念:次数分布中所有原始数据与平均数绝对离差的平均值。公式:,平均差的优缺点,平均差是根据分布中每一个观测值计算求得的,它比较好地度量了次数分布的离散程度。平均差的计算要取绝对值。但不利于进一步的统计分析,故在统计实践中平均差不常使用。,方差与标准差,概念:方差:(variance),又称变异数,均方(mean square),指离均差平方的和的平均。总体方差表示为s,样本方差表示为。标准差:(standard variance),指方差的平方根。总体标准差表示为,样本标准差表示为S或SD。,方差与标准差,公式:总体样本,方差
11、与标准差的性质,方差具有可加性,可分解性。是统计推论中最常用的统计特征数。标准差:全组数据每一观测值都加上一个相同的常数c后,计算得到的标准差不变若每一观测值都乘以一个相同的非零常数c,则所得的标准差等于原标准差乘以这个常数的绝对值若每一观测值都乘以一个相同的非零常数c,再加上一个常数d,计算得到的标准差不变,差异系数,概念:将差异量数与集中量数相对比后所形成的相对差异量数。公式:适用情境:两个或两个以上样本所测的特质不同两个或两个以上样本所测的特质相同,但样本间的水平相差较大,地位量数,概念:研究对象某一属性的数量化指标,即原始变量在其所处分布中地位的量数百分等级(PR)反映的是某个观测分数
12、以下数据个数占总个数的比例的百分数,在 0到100之间取值。百分位数:位于特定百分等级位置上的一个数,它是次数分布中或量尺上的一个数。正态分布中的百分等级,本章课后习题练习,第四章:相关分析,集中量数和差异量数主要用于描述单变量数据资料,相关系数则用于描述双变量数据相互之间的关系。事物之间关系:因果关系:两类现象之间存在明确的条件与结果之间的关系。共变关系:表面上看来有联系的两事物都与第三种有关。相关关系:两类现象在发展变化的方向与大小方面确实存在一定的联系,但又不是因果或共变关系时,称这种关系为相关关系,在统计学中相关有时被解释为两种特征相伴随的变化。相关方向:正相关:变量之间变动方向相同,
13、同增同减,0r1;负相关:变量之间变动方向相反,一个增加,另一个则变小,-1r0;零相关:变量之间的变动完全没有规律可循,r=0。,相关系数及其解释,概念:相关系数(coefficient of correlation)是两列变量间相关程度的数量化指标。解释:相关系数的大小(绝对值)表示两类数据的密切程度。正号表示正相关,负号表示负相关当r=+1.00时,表示完全正相关;当r=-1.00时,表示完全负相关;当r=0时,表示几乎没有联系r0.7高相关;0.40.7之间中等相关;0.4之下低相关相关系数仅仅是一个比值,不是等距的,也不是百分比,因此不能进行四则运算,也不能用倍数关系表示,正、负号仅
14、表示方向有相关关系不一定是因果关系散点图,常用相关关系与计算,积差相关等级相关点双列相关,积差相关,皮尔逊积差相关公式:适用情境:成对的数据,N30对两个变量的总体都呈正态分布(即正态双变量),或接近正态分布,至少是单峰对称分布,当然样本并不一定要正态两个变量都是由测量获得的连续性数据,即等距或等比数据两个变量之间呈线性关系,等级相关,公式:两列等级顺序数据或非正态等距、等比数据样本容量不做限制,n30也可以。,点双列相关,公式:p是二分类数据中某类事物所占的比例q是二分类数据中另一类事物所占的比例适用情境:一列来自正态总体的等距或等比的测量数据另一列变量为二分称名变量。,课后练习题,第五章:
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 教育统计 自学考试 教育 统计 复习 课件
链接地址:https://www.31ppt.com/p-4282434.html