《教育统计学》PPT课件.ppt
《《教育统计学》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《教育统计学》PPT课件.ppt(142页珍藏版)》请在三一办公上搜索。
1、教育测量与评价2011.0211.06,教材:华东师范大学王孝玲编著课时数:6472课时,3-4学分。章节数:共十五章,三大部分描述统计,推断统计,抽样设计,教育统计学,695013,两个理论基础,“凡物的存在必有其数量”(美国心理学家桑代克18751949)“凡有数量的东西都可以测量”(美国测量学者麦柯尔),复杂的因果关系:随机现象,在因果关系复杂的条件下无法根据已知的有限原因精确地预测结果因为即使在已知条件相同的情况下,每一次预测也都是有偏差的随机现象,学生成绩心理测验得分候车人数作物产量产品质量收入支出等等,随机现象,在一定的条件下,可能出现也可能不出现,可能这样出现,也可能那样出现的一
2、类现象。特征:条件不能完全决定结果。研究内容:出现的可能性有多大,不出现的可能性有多大,或者这样出现的可能性有多大,那样出现的可能性有多大。,数量差异性与数量规律性,数量差异性:一定条件下,出现可能不一样;数量规律性:通过大量试验和观察,总结出随机现象的规律。数量规律性:平均数;方差、标准差;比率、百分比;相关系数等。非数量规律性:数量分布,二、统计学和教育统计学,统计学就是研究随机现象的数量规律性的一门数学分支。,1、统计学含义:,Statistics原意是国力、国势,定义1:统计学是研究统计原理和方法的科学。P1,定义2:统计学是研究如何搜集、整理、分析反映事物总体信息的数字资料,并以此为
3、依据,对总体特征进行推断的原理和方法。研究什么(对象)、怎么做?干什么(目的),“研究搜集、整理、分析数字资料推断“总体特征”原理和方法,部分推断全体,2、教育统计学的含义:,教育统计学是运用数理统计的原理和方式研究教育问题的一门应用科学。它的主要任务是研究如何搜集、整理、分析由教育调查和教育实验所获得的数字资料,并以此为依据,进行科学推断,从而揭示蕴含在教育现象中的客观规律。,(教育与心理统计学),三、统计学与教育统计学的内容,数理统计学1.统计学教育统计学应用统计学 农业统计学 人口统计学,2.统计学或教育统计学具体内容:,三、统计学与教育统计学的内容,统教计育学统或计学,描述统计,推断统
4、计,实验设计,统计图表集中量数差异量数相关分析,统计估计假设检验,参数估计非参数估计,点估计区间估计,参数检验非参数检验,样本选择与分配实验误差分析因子分析,方差分析回归分析,抽样设计,三、统计学与教育统计学的内容,1、描述统计(descriptive statistics):对已获得的数据进行整理、概括,显现其分布特征的统计方法。P2(主要是对样本数据的处理),2、推断统计(inferential statistics):根据样本所提供的信息,运用概率的理论进行分析、论证,在一定可靠程度上对总体分布特征进行估计、推测的统计方法。(在一定风险下,部分推断全体),3、实验设计(experimen
5、tal statistics):为提示实验中自变量与因变量的关系,在实验之前所制订的实验计划。,1.确定现象2.随机现象,随机事件,随机变量。统计处理的变量都是随机变量。,五、统计学中几个基本概念,3.个体(Case)、总体(Population)与样本(Sample)总体无限总体与有限总体;表示数目样本大样本(n30)与小样本(n30)总体与样本是相对的,4.统计量(Statistic)与参数(Parameter)统计量:样本上的数字特征;参数:总体上的各种数字特征。,总体,样本,统计量,描述统计,作出推断,随机抽样,描述,总体、样本与个体,一、统计数据,来源数据 种类 特性:统计分类,:报
6、表,:二分法和四分法,变异性、规律性,1、按数据观测方法和来源:,数据种类(数据的水平),二分法,2、按数学属性:,(百分制的分数理论上讲是间断的,但由于数据密度大较多,实际处理时归入连续型数据处理,连续型数据处理较方便,类似以后也有,总体比率用正态分布处理。),间断型随机变量,取值个数有限的数据人数个数名次五分制得分,连续型随机变量,取值个数无限的数据身高体重智商时间长短百分制得分,问题:为什么要进行数据分类?,数据有不同属性(可分);不同类型数据用不同统计方法处理。,1、按数据观测方法和来源:点计数据(计数数据)与度量数据(测量数据)。2、按数学属性:间断(离散)数据与连续数据。,数据种类
7、(数据的水平),四分法,3、按数据测量水平,称名数据等级(顺序)数据等距数据等比数据(比率数据),(标题、表号、标目、线条、数字、表注)六部分;(标题、图号、标目、图形、图注)五个方面。简单表、分组表(1个标志)、复合表(2个及以上标志直条图(条形图)、圆形图、线形图、频数分布图,多变量图:散点图、雷达图、脸谱图等,二、统计表、统计图,例1.小教本011(30名)教育统计学单元考试成绩58、61、88、74、81、66、70、93、72、91、66、99、89、98、90、98、90、64、93、89、100、91、92、97、90、94、99、92、92、90。,频数分布表制作步骤,58、6
8、1、88、74、81、66、70、93、72、91、66、99、89、98、90、98、90、64、93、89、100、91、92、97、90、94、99、92、92、90。,一般不少于5组,也不要超过15组。组距指的是每一个组内包含的距离(用i表示)斯特奇斯(H.A.Sturges)根据经验公式:,本例为i=7.11,将组距调节为10,即每10分为一个组。组数:42/10=4.2,应该分5组。,1)求全距R:,全距指的是全部观察值中最大值与最小值之差。,R=xmax-xmin=10058=42。,2)决定组数k和组距i。KR/i,频数分布表制作步骤,3)决定组限组限就是每一组的起点值和终点值
9、。4)登记频数,小教本011教育统计学单元考试学生成绩频数、累积频数分布表,小教本011教育统计学单元考试学生成绩频数分布直方图,第三章常用的特征量,1.集中量:平均数、中位数、众数;百分位数2.差异量:全距、四分位距、平均差、方差和标准差、差异系数;百分位距。3.地位量:4.相关量:5.分布形态量:偏态量、峰态量。,集中量,集中量是代表一组数据典型水平或集中趋势的量。它能反映频数分布中大量数据向某一点集中的情况。,集中量包括算术平均数、加权平均数、几何平均数、调和平均数、中位数、众数等。,算术平均数,算术平均数是所有观察值的总和除以总频数所得之商,简称为平均数或均数。,样本平均数 总体平均数
10、,算术平均数的优点,反应灵敏;严密确定,简明易懂,计算方便;适合代数运算;受抽样变动的影响较小;样本算术平均数是总体平均数的最好估计值,算术平均数的缺点,易受两极端数值(极大或极小)的影响;,一组数据中某个数值的大小不够确切时就无法计算其算术平均数。,这种“两极端数值”存在的问题,可用什么办法解决?,中位数(Md),中位数是位于依一定顺序排列的一组数据中央位置的数值,在这一数值上、下各有一半频数分布着。,中位数的原始数值计算方法:单数:12 14 15 15 17 18 20 23 24:17双数:12 14 15 15 17 18 20 23 24 25:17.5,中位数的应用及其优缺点,中
11、位数虽然也具备一个良好的集中量所应具备的某些条件,例如比较严格确定、简明易懂,计算简便,受抽样变动影响较小,但是它不适合进一步的代数运算。它适用于以下几种情况:,(1)一组数据中有特大或特小两极端数值时;,(2)一组数据中有个别数据不确切时;,(3)资料属于等级性质时。,众数(Mo),众数是集中量的一种指标。对众数有理论众数及粗略众数两种定义方法理论众数是指与频数分布曲线最高点相对应的横坐标上的一点。粗略众数是指一组数据中频数出现最多的那个数。,众数的优缺点,众数虽然简明易懂,但是它并不具备一个良好的集中量的基本条件。它主要在以下情况下使用:当需要快速而粗略地找出一组数据的代表值时;当需要利用
12、算术平均数、中位数和众数三者关系来粗略判断频数分布的形态时;利用众数帮助分析解释一组频数分布是否确实具有两个频数最多的集中点时。,正态,正偏态,负偏态,P34,加权平均数,加权平均数是不同比重数据(或平均数)的平均数。计算公式为:,二、差异量,1.差异量:表示一组数据变异程度或离散程度的量。,2.类型:全距、四分位距、平均差、方差和标准差、差异系数;百分位距。,注:差异量越大表明数据越参差不齐,分布范围越广。,二、差异量,1、全距(Range):R=xmax-xmin,例1 10、50、58、61、63、69、71、71、71、78、81、83、86、86、88、99。(16),3、百分位距P
13、D:P93 P7 P90 P10,4、平均差:,5、方差和标准差:,2、四分位距QD(Q3 Q1)/2,=99-10=89,二、差异量例1 10、50、58、61、63、69、71、71、71、78、81、83、86、86、88、99。,5、方差和标准差:,计算方法:1)原始数据法;2)计算工具法;3)其他,1)原始数据法:,3)计算工具法:,4)数学软件:spss等,2)频数分布表计算法:,问题讨论:一组数据的标准差,大好呢?还是小好?,二、差异量,6、相对差异量:差异系数,用途:1)比较不同单位资料的差异程度(单位不同)2)比较单位相同而平均数相差较大(对象不同)3)判断特殊差异情况,正常
14、范围:5%CV35%不 正 常:CV35%平均数无意义CV5%数值计算正确性,应用1)非零点;条件:2)等比量表。,三、分布形态量偏态量与峰态量,1、偏态量,SK0:分布对称SK0:偏态,SK0:正偏SK0:负偏,2、峰态量,Ku0.263:正态峰Ku 0.263:非正态,Ku 0.263:低阔峰Ku 0.263:高狭峰,偏态量,负偏,正偏,第五章概率及概率分布,概率的一般概念概率分布:离散分布与连续分布二项分布与正态分布正态曲线的面积与纵线正态分布在测量上的应用,5.1概率(probability)的一般概念一、概率的定义二、概率的性质,0P(A)1P(A)0:不可能事件P(A)1:必然事件
15、,三、概率的加法和乘法,小概率事件A:p(A)0.05小概率原理:小概率事件在一次试验中,几乎不可能发生。,5.2二项分布(bionimal distribution),二、二项分布函数,2.二项分布函数,在n次试验中成功事件P恰好出现x次的概率,例在男生占2/5的学校中随机抽取10个学生,问正好抽到4个男生的概率是多少?至多抽到2个男生的概率是多少?,1)是否是二项试验?,2)共试验次数?,3)所求随机事件出现次数?,例在男生占2/5的学校中随机抽取10个学生,问正好抽到4个男生的概率是多少?至多抽到2个男生的概率是多少?,解:,随机抽取一个学生即随机试验一次,因为试验结果只有两个:“男生”
16、与“女生”,而且抽到男生与抽到女生是没有关系的,故此试验是贝努利试验。,正好抽到4个男生的概率:,至多抽到2个男生的概率是:,二项分布(bionimal distribution),5.2二项分布(bionimal distribution),三、二项分布图,二项分布的形态:,Pq:对称,pq:偏态,1)当n时,二项分布正态分布;,2)当np5且nq 5时,二项分布开始接近正态分布。,5.2二项分布(bionimal distribution),四、二项分布的平均数和标准差,当二项分布开始接近正态分布时,在n次二项试验中成功事件出现的平均数和标准差是:,例从我们班中随机抽取10名同学,从理论上
17、讲,平均应抽到男生多少个?标准差是多少?,五、二项分布的应用,1.求n次二项试验中成功事件出现的概率;2.判断试验结果的机遇性与真实性的界限(1的反向)。,正态分布 的图形特点,正态分布的密度曲线是一条关于 对称的钟形曲线.,特点是“两头小,中间大,左右对称”.,即,取x=附近值的可能性大,取偏离x=越远的值的可能性越小。,5.3正态分布(normal distribution)二、正态曲线的面积与纵线,2.标准正态曲线下的面积及Z值计算:2)查表法,A、已知Z值求面积P:,a)求P(0zz1):,b)求P(zz1)或P(z-z1):,c)求P(z1zz2):,例1,P(0z1.96)、P(-
18、2.58z0),例2,P(z1)、P(z-1.96)、P(z1.96),例3,P(1z2)、P(-1z2)、P(-1.96z1.96),例某班48人的数学考试成绩分布呈正态分布,其平均分为75分,标准差为10,问理论上说65至85分之间当有多少人?,已知:,n=48,求 P(65x85),分析:由正态分布图,,要求65至85之间的理论人数,,即,,解:,=-1,查表得:,P(-1Z1),2P(0Z1),20.3413,0.6826,P(65x85)48,P(-1Z1)48=0.682648,32.8,所以,,只要知道这部分在全部48人中的份额,,48,5.3正态分布(normal distri
19、bution)三、正态分布在测验记分方面的应用,1.将原始分数转换成标准分数Z值;2.确定录取的分数线;3.确定等级评定的人数;4.品质评定数量化。,5.3正态分布(normal distribution)三、正态分布在测验记分方面的应用 1.将原始分数转换成标准分数Z值;,例1.2001年某市公务员选拔考试甲、乙二人成绩:,0.22,1.12,5.3正态分布(normal distribution)三、正态分布在测验记分方面的应用,1.将原始分数转换成标准分数Z值;,结论:Z甲 Z乙,标准分数体系:,T=KZ+C,T10Z50,例1.2001年某市公务员选拔考试甲、乙二人成绩:,1.06,0
20、.91,5.3正态分布(normal distribution)三、正态分布在测验记分方面的应用,1.将原始分数转换成标准分数Z值;,例1.2001年某市公务员选拔考试甲、乙二人成绩:,T10Z50,标准分数体系:,T=KZ+C,60.6,59.1,5.3正态分布(normal distribution)三、正态分布在测验记分方面的应用,1.将原始分数转换成标准分数Z值;2.确定录取的分数线;,例1某年高考平均分500,标准差100,考分呈正态分布,某考生得到650分。设当年高考录取率为10,问该生能否被录取?,录取率10%X0=?,P(ZZ0)0.1,P(0 Z Z0)0.4,Z01.28,
21、X0=628,5.3正态分布(normal distribution)三、正态分布在测验记分方面的应用,1.将原始分数转换成标准分数Z值;2.确定录取的分数线;,例2某项职业录取考试,在参加的1600人中准备录取200人,考试分数接近正态分布,去年同样考试的平均分数为74分,标准差为11,问今年录取分数会多少?,求录取率 p=n/N,P(ZZ0)p,P(0 Z Z0)0.5-p,Z0,已知录取人数 求最低录取分数,查表,5.3正态分布(normal distribution)三、正态分布在测验记分方面的应用 3.确定等级评定的人数;,例2如果100个人的教育实习成绩呈正态分布,现将其分成优、良
22、、中、合格、不合格五个等距的等级,问各等级应有相应的多少人?,等距分点,已知等级数k求各等级人数ni,确定相应界值Zi,求相应面积Pi,第六章抽样分布及总体平均数的推断,总体分布、抽样分布、样本分布样本平均数与总体平均数离差统计量的形态总体平均数的估计假设检验基本原理总体平均数显著性检验抽样分布参数估计假设检验,6.1抽样分布及有关性质,例2某市共有3600人大学生参加了全市大二学生的统一英语测试,现在随机抽取50人为样本,其平均分数为85分,标准差10分,试问该市平均分数为多少?,平均数抽样分布:容量为50,一切可能个的样本平均数的频数(频率)分布。,所有样本平均数的平均数,抽样分布的平均数
23、,平均数,6.1抽样分布及有关性质,总体分布:总体内个体数值的频数分布。抽样分布:某一种统计量的概率分布。样本分布:样本内个体数值的频数分布。,平均数抽样分布、标准差抽样分布、中位数抽样分布,抽样分布,6.1抽样分布及有关性质,1.分布概念及相关符号,总体分布:总体内个体数值的频数分布。抽样分布:某一种统计量的概率分布。样本分布:样本内个体数值的频数分布。,平均数标准差,又称平均数标准误,反映了抽样误差的大小。,平均数抽样分布标准差 意义?,6.1抽样分布及有关性质,1.分布概念及相关符号2.平均数抽样分布的几个定理,4)总体不是正态分布,如果样本容量较大,则反映总体和的样本平均数的抽样分布,
24、也接近正态分布。,又称平均数标准误,反映了抽样误差的大小。,1),2),3)从正态总体中,随机抽取的容量为n的一切可能样本平均数的分布(平均数抽样分布),也呈正态分布,6.1抽样分布及有关性质,3.样本平均数与总体平均数离差统计量的形态,1)总体标准差 已知:正态分布。Z分布:,2)总体标准差 未知:,t分布,6.1抽样分布及有关性质,3.样本平均数与总体平均数离差统计量的形态,1)已知:Z分布,2)未知:t分布,t分布(t-distribution)英国统计学家高赛特(W.S.Gossett)1908年以笔名“student”发表的一篇论文中推导的一种分布。因此也称为学生分布。,6.2 总体
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 教育统计学 教育 统计学 PPT 课件
链接地址:https://www.31ppt.com/p-5518794.html