欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    教育统计学ppt课件.ppt

    • 资源ID:1912056       资源大小:3.10MB        全文页数:288页
    • 资源格式: PPT        下载积分:16金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要16金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    教育统计学ppt课件.ppt

    教育统计学,Psychological Statistics,教育统计学,课程性质和教学要求,课程的性质: 教育统计学是教育学与统计学交叉结合的学科,同时也是一门应用统计学,是数理统计方法在教育领域的具体应用。它通过量化的手段来分析、认识教育现象和规律,是一门重要的工具性学科。教学目标和要求: 理解教育统计学的基本概念和原理,掌握从事教育科学研究所必需的一些统计方法,能按照要求对数据进行描述统计与推断统计分析处理,形成较强的统计意识,在今后的实际研究中具有正确地选择、运用统计方法解决实际问题的能力。,教育统计学参考书,1、王孝玲编著的教育统计学(修订二版) 上海:华东师范大学出版社,2001, 2、杨宗义主编的教育统计学 重庆:科学技术文献出版社重庆分社,1990. 3、王汉澜主编的教育统计学 北京:教育科学出版社,1985. 4、叶佩华等编著的教育统计学 北京:人民教育出版社,1982. 5、张敏强主编的教育与心理统计学(修订本) 北京:人民教育出版社,2002. 6、温忠麟、邢最智编著的现代教育与心理统计技术 南京:江苏教育出版社,2001. 7、郝德元编著的教育与心理统计 北京:教育科学出版社,1982. 8、左任侠编著的教育与心理统计 上海:华东师范大学出版社,1982. 9、张厚粲主编的心理与教育统计学 北京:北京师范大学出版社,1993. 10、林清山编著的心理与教育统计(修正版第15版) 台湾:东华书局,民国78年1989.,第一章绪论,教育统计方法在教育科学研究中的作用 教育统计学的内容 教育统计学的发展 教育统计学中几个基础概念,什么是教育统计学,教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析教育科学研究中获得的随机性数据资料,并根据这些数据资料所传递的信息,进行科学推论找出教育活动规律的一门科学。 具体讲,就是在教育研究中,通过调查、实验、测量等手段有意获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。,教育统计学的性质,教育统计学是心理学与统计学交叉结合的学科,是数理统计方法在教育领域的具体应用,属于应用统计学的范畴,是应用统计学的一个分支。它是教育科学研究中广泛应用的、也是最基本的一种定量化的研究工具。,教育统计学和数理统计学的关系,数理统计学研究的领域包括怎样设计一个实验,如何从局部观测推论整体情况,如何从特殊情况推论一般规律,如何对假设进行推论估计与检验等等。 教育统计学偏重于数理统计方法如何在教育科学研究中的应用,因而对各种统计方法公式的推导及理论上的证明介绍较少,着重介绍各种统计方法在不同的教育研究中应用的条件和具体方法,及其统计结果的解释。 一般讲,教育统计学介绍的方法,大都是数理统计学已确认的,但是,随着教育科学研究的发展与深入,实践中会提出更多的如何处理数据的问题,需要教育统计学加以研究解决,这又为数理统计提供或补充了新的研究内容。可见,数理统计学和教育统计学二者之间是理论与实践的关系。,学习教育统计学的意义,(1)统计学为科学研究提供了一种科学方法。 (2)教育统计学是教育科学研究定量分析的重要重要工具。 (3)广大教育工作者学习教育统计学既可以顺利地阅读国内外先进的研究成果,又可以提高工作的科学性和效率,同时也为学习教育测量打下基础。,教育科学研究数据的特点,(1)教育科学研究数据与结果多用数字形式呈现; (2)教育科学研究数据具有随机性和变异性; (3)教育科学研究数据具有规律性; (4)教育科学研究的目的是通过部分数据来推测总体特征。 总之,在教育科学实验或调查中,所获得的数据都具有变异性与规律性的特点。,学习教育统计学要注意的问题,(1)在学习教育统计学时,必须克服畏难情绪。(2)在学习时要重点掌握各种统计方法使用的条件。(3)要做一定的练习。,在应用教育统计学各种方法时要切记的要点,(1)克服“统计无用”与“统计万能”的思想,要注意科研道德。 (2)正确地选用统计方法,防止乱用统计。,思考题,选用统计方法有哪几个步骤?, 要分析一下实验设计是否合理,即所获得的数据是否适合用统计方法去处理,正确的数量化是应用统计方法的起步,如果对数量化的过程及其意义没有了解,将一些不着边际的数据加以统计处理是毫无意义的。 要分析实验数据的类型。不同数据类型所使用的统计方法有很大差别,了解实验数据的类型和水平,对选用恰当的统计方法至关重要。 要分析数据的分布规律,如总体方差的情况,确定其是否满足所选用的统计方法的前提条件。,答:,教育统计学的分类,(1)依研究的问题实质来划分,教育统计学的研究内容可划分为描述一件事物的性质、比较两件事物之间的差异、分析影响事物变化的因素、一件事物两种不同属性之间的相互关系、取样方法等等。 (2)依统计方法的功能进行分类,教育统计学的研究内容可分为描述统计、推论统计和实验设计。,描述统计,主要研究如何整理科学实验或调查得来的大量数据,描述一组数据的全貌,表达一件事物的性质。 具体内容包括: (1)数据如何分组,如何使用各种统计图表描述一组数据的分布情况; (2)怎样计算一组数据的特征值,简缩数据,进一步描述一组数据的全貌; (3)表示一事物两种或两种以上属性间相互关系的描述及各种相关系数的计算及应用条件,描述数据分布特征的峰度及偏度系数计算方法等。,推论统计,主要研究如何通过局部数据所提供的信息,推论总体(或称全局)的情形。 具体内容包括: (1)如何对假设进行检验,即各种各样的假设检验,包括大样本检验方法(z检验),小样本检验方法(t检验),各种计数资料的假设检验的方法(百分数检验、2检验等),变异数分析的方法(F检验),回归分析方法等等。 (2)总体参数的估计方法。 (3)各种非参数的统计方法等。,实验设计,主要目的在于研究如何科学地、经济地以及更有效地进行实验。 具体内容包括:在实验以前对研究的基本步骤、取样方法、实验条件的控制、实验结果数据的统计分析方法等作出严格的规定。,描述统计、推论统计和实验设计这三部分统计内容有何关系?,思考题,教育统计学的三个组成部分的内容不是截然分开的,而是相互联系的。描述统计是推论统计的基础,推论统计离不开描述统计计算所获得的特征值;描述统计只是对数据进行一般的分析归纳,如果不进一步应用推论统计作进一步的分析,描述统计的结果就不会产生更大的价值和意义,达不到统计分析的最终目的要求。同样,只有良好的实验设计才能使所获得的数据具有意义,进一步的统计处理才能说明问题。当然一个好的实验设计,也必须符合基本的统计方法的要求,否则,再好的设计,如果事先没有确定适当的统计方法处理,在处理研究结果时可能会遇到许多麻烦问题。,答:,教育统计与心理统计的异同,相同之处:二者的研究对象都是人,教育现象在很多情况下要通过人的心理现象去观察和分析,统计方法基本相同。 不同之处: 在统计方法上:在教育方面的研究中,大样本的统计方法应用较多;而在心理学上小样本的方法较多。 在实验设计的水平上:教育实验中控制因素较难,采用自然实验、准实验设计方式较多,对统计结果的解释需要特别谨慎;而心理学实验则在实验室条件下进行较多,对各种实验变量的控制相对容易,统计处理结果的解释也较易进行。,统计学的发展历程,(1)最初的统计是统治者用以治国的方法,对于人口、土地、物产、贡赋、士兵与战车等都需要统计。 (2)随着科学的进步,在概率论的基础上逐步形成了推测性的数理统计。 (3)数理统计的发展经历了两个阶段:描述统计学与推论统计学。描述统计学产生于20世纪20年代之前,以高尔顿和皮尔逊为代表。推论统计学产生于20年代之后,以费舍为代表。 (4)二战以后,非参数方法、序列分析、随机过程的研究、小样本分布这些都逐渐被认识和应用。而且随着一元统计方法的逐步完善与拓宽,多元统计理论与方法也被应用到各种实际研究中。,统计在教育与心理研究中的应用,(1)作为一门应用统计学分支学科,教育统计学基本上是随着数理统计的发展而发展的;同时心理与教育研究的发展也不断充实着统计学的方法。许多现代统计学理论最初是来自教育与心理研究的。例如,因子分析源出于心理学研究。 (2)英国的高尔顿最早将统计方法应用于心理学研究,首创回归原理。皮尔逊也将相关系数及2检验等应用于心理研究中。斯皮尔曼对心理统计的发展做了很多工作,延伸了相关系数的概念,导出等级相关系数的计算方法;提出因子分析的思想,用统计方法处理心理实验结果。 (3)贡献较大的有卡特尔、桑代克、瑟斯顿等人。1904年,桑代克出版心理与社会测量一书,极力提倡以心理学与统计学为工具而研究教育学,推广运用统计方法研究心理与教育方面的实验结果。20世纪20年代,瑟斯顿等人对因素分析在心理学研究中的广泛应用也作了很大贡献。,统计在中国的发展与应用,(1)教育与心理统计学在辛亥革命以后传到我国。当时教育与心理统计、教育与心理测量都作为高等、中等师范院校的必修课程,有一大批专家、学者从事这方面的研究、讲授工作,出版了不少关于教育与心理统计方面的译著、专著。 (2)20世纪80年代以后,教育与心理心理统计学开始复苏。在二十多年中,我国的教育与心理统计学科在教学、研究、培养人才等各方面取得了非常丰硕的成果。 (3)目前,教育与心理统计学的教学和研究进入稳步快速发展时期。,数据的类型(一),从数据的观测方法和来源划分,研究数据可区分为计数数据和测量数据两大类。 计数数据是指计算个数的数据,一般属性的调查获得的是此类数据,它具有独立的分类单位,一般都取整数的形式。 测量数据是借助于一定的测量工具或一定的测量标准而获得的数据。,数据的类型(二),根据数据反映的测量水平,可把数据区分为称名数据、顺序数据、等距数据和比率数据四种类型。 称名数据只说明某一事物与其它事物在属性上的不同或类别上的差异,它具有独立的分类单位,其数值一般都取整数形式,只计算个数,并不说明事物之间差异的大小。 顺序数据是指既无相等单位,也无绝对零点的数据,是按事物某种属性的多少或大小,按次序将各个事物加以排列后获得的数据资料。 等距数据是具有相等单位,但无绝对零点的数据。 比率数据既表明量的大小,也有相等单位,同时还具有绝对零点的数据。,数据的类型(三),按照数据是否具有连续性,把数据划分为离散数据和连续数据。 离散数据一般取整数,在两个单位之间不能再划分细小单位。 连续数据的单位可以划得很细微,细微的程度能达到只可想象而不能看见的程度。,变量、观测值、随机变量,变量是指教育实验、观察、调查中想要获得的数据。观测值是指某一变量的某个确定的取值。随机变量是指在取值之前不能预料取到什么值的变量。 作为连续随机变量,其数值只是表示连续变量的中央点值,在数轴上表示的是一段距离,或一个区间。因此,一个随机变量不管写成整数或小数,实际是用一个单位的中央点表示在它以上和以下各有一段距离。例如:连续随机变量1是表示0.51.499。但在心理统计中也有例外的情况。如年龄的表示,一般5岁是指5岁开始到5岁11个月又30天。 而作为离散的随机变量,其数值表示的是数轴上的一个点值。,总体、个体和样本,总体是指具有某种特征的一类事物的全体。构成总体的每个基本单元称为个体。从总体中抽取的一部分个体,称为总体的一个样本。 样本中包含的个体数目称为样本容量,一般用n表示。一般情况下,n 30 的样本称为大样本;n 30 的样本称为小样本。,次数、频率与概率,次数(频数) 次数是指某一事件在某一类别中出现的数目。一般用符号f表示。 频率(相对次数) 频率是指某一事件的次数被总的事件数目除。亦即某一数据出现的次数被一组数据总个数去除。频率通常用比例或百分数表示。 概率(机率或然率) 概率是指某事件在无限的观测中所能预料的相对出现的次数。换一句话说,就是某一事件或某种情况在某一总体中出现的比率。概率常用符号P表示。,统计量和参数,统计量是指样本的特征值。它是根据科研实验所获得的一组观测值计算出来的一些量数,它可以描述一组数据的情况。 参数是指总体的特征值。它是描述一个总体情况的一些统计指标。,思考题,统计量与参数之间有何区别和联系?,区别: 参数是从整个总体中计算得到的量数,通常是通过相应样 本特征值来预测得到;统计量是从一个样本中计算出来的 一些量数,它可以描述一组数据的情况。 参数代表总体的特性,它是一个常数;统计量代表样本的 特性,它是一个变量,随着样本的变化而变化。 参数与统计量之间最明显的区别是参数常用希腊字母表 示,而统计量常用英文字母表示。 联系:从数值计算上讲,当总体大小已知并与实验观测的总次数相 同时,统计量与参数是同一统计指标;当总体为无限时,统 计量与总体参数不同,但统计量可在某种程度上作为总体参 数的估计值。通过样本统计量,对总体参数做出预测和估计。,答:,第二章 统计图表,数据的初步整理 次数分布表 次数分布图 其他类型的统计图表,数据初步整理的方法,(1)数据排序 数据排序是指按照某种标准,对收集到的杂乱无章的数据按照一定的顺序标准进行排列。 数据排序是整理数据最简单的方法。 (2)统计分组 统计分组是指根据被研究对象的特征,将所得数据划分到各个类别中去。 对研究中所获得的大量数据进行统计分组是对数据进行整理的重要步骤。,统计分组应注意的事项,统计分组前的准备 将数据进行分组前,先要对观测数据做进一步的核对和校验。校核数据的目的是为了尽可能地消去记录误差,以便后续的统计分析建立在一个坚实的基础上。统计分组时应注意的问题 分组要以被研究对象的本质特性为基础; 分类标志要明确,要能包括所有的数据。,统计分组标志的类型,(1)性质类别 主要是根据事物的属性不同将被观测的事物加以划分,反映事物在组别、种类上的不同,不说明事物之间的数量差异。 性质类别可根据事物的性质及研究的需要分成不同的层次,每个层次又可分为不同数量的细目。 (2)数量类别 这是以数据的取值大小为分类标志,把数据按数值大小以分组或不分组的形式排出一个顺序来。,统计表,统计表的作用 统计表是用来表达统计指标与被说明的事物数量关系的表格。它可以将大量数据的分类结果,清晰、概括、一目了然地表达出来,明显地反映出事物的全貌及其蕴涵的特性,具有简明、清晰、准确的特点,表中的数据易于比较分析。统计表的结构 统计表一般由表号、名称、标目、数字、表注等项构成。统计表的编制要求 按统计表的结构逐项说明编制的要求(见教材P2728)。,统计表的结构和组成要素图示,表21 80名员工对部门主管尽职程度调查结果,表号,标题,标目,表注,* 注:表中的数据来源于例2-1,标目,顶线,表线,数字,底线,统计图,统计图的作用 统计图是用来表达统计指标与被说明的事物之间数量关系的图形。它以直观形象的形式表达出事物的全貌及其分布特征,给人简明扼要、清晰易懂的印象,便于学习与记忆。 统计图的结构 统计图由图号、图题、图目、图尺、图形、图例、图注等项构成。 统计图的绘制要求 按统计图的组成部分逐项说明绘制要点(见教材P2829)。,统计图结构要素意图,Y轴名称,尺度单位,填充图案,轮廓线,基线,X轴名称,刻度标记,图尺,图号,图题,图目,简单次数分布表,简单次数分布表就是依据每一个分数值在一列数据中出现的次数或总计数资料编制成的统计表。 在心理与教育研究中,许多态度、兴趣、偏好等测验或调查的结果,都能制作成这种简单次数分布表。,分组次数分布表的概念,当数据量很大时,应该把所有的数据先划分为若干分组区间,然后将数据按其数值大小划归到相应的组别内,分别统计各个组别中包括的数据个数,再用列表形式呈现出来,就构成了分组次数分布表。,(1)求全距(R): (2) 决定组数(K)与组距( i ):决定组距的大小,需要以全距为参考。组数的多少要根据数据的多少来定。 如果数据的总体分布为正态,可用经验公式: 来计算组数,然后由公式: 来确定组距。 (3) 列出分组区间:列分组区间要注意以下几点: 最高组区间内应包含最大值的数据,最低组区间应能含最小值的数据; 最高组或最低组的下限最好是组距的整数倍; 各分组区间一般在纵坐标上按顺序排列,数值大的分组区间排在上面,数值小的分组区间排在下面。 (4) 登记次数:依次将数据登记到各个相应的组别内,一般用划线记数或写正字的方法。 (5) 计算次数:根据登记的结果计算各组的次数,计算各组次数的总和即总次数。 (6) 抄录新表:新表包括的栏目有:第一列为分组区间,第二列为各分组区间的组中值,第三列为次数。,分组次数分布表的编制步骤,分组次数分布表的意义与缺点,分组次数分布表的意义 编制分组次数分布表,可将一堆杂乱无序的数据排列成序。从表中可以发现各个数据的出现次数是多少,其分布的状态如何。 分组次数分布表的缺点 分组次数分布表也有缺点,仅从这张表看,原始数据不见了,只见到各分组区间及各组的次数。根据这样的统计表提供的数据资料计算得到的平均值,会与用原始数据计算的值有一定的出入。,将分组次数分布表中各组的实际次数转化为相对次数,即用频数比率( )或百分比( )来表示次数,就可制成相对次数分布表。,相对次数分布表,累加次数分布表,在一般的分组次数分布表上,只标出各分组区间的数据次数。如果想知道某个数值以下或以上的数据的数目,就要用累加次数。 累加次数是把各组的次数由下而上,或由上而下累加在一起。最后一组的累加次数应等于数据的总次数。用累加次数表示的次数分布表称为累加次数分布表。 累加次数分布表中,累加次数可用实际次数,亦可用相对次数。累加次数的计算方法有两种: 从分布表的小数值端,逐区间的进行次数累加,这种累加次数可回答次数分布表某一分组区间上限以下的次数是多少。 从分布表的大数端逐区间的次数累加,这种累加次数可回答某一分组区间下限以上的次数是多少。,双列次数分布表,双列次数分布表是对有联系的两列变量用同一表表示其次数分布。 所谓有联系的两列变量,是指同一组被试中每个被试两门学业成绩分数,或两种能力分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果等。再如,各方面基本相同的两个被试进行同一测量所得的结果也是有联系的。如果有多个这样的被试,他们的测试数据也构成有联系的两列变量。 编制双列次数分布表,首先按照分组次数分布表的编制方法,分别列出各变量的分组区间,将一列变量的分组区间竖列,将另一变量横列。竖列的小数端在下,大数端在上,横列的小数端在左而大数端在右。登记时,每次同一对变量同时登记在相应的格内。,不等距次数分布表,一般分组次数分布表都是等距的。但实际研究中常遇到不等距的情况,如工资级别,年龄分组等,若按等距分组不能确切地反映实际情况,这时可采用不等距分组的方法。这样的不等距分组的分组次数分布表就叫做不等距次数分布表。,直方图,直方图(等距直方图)是以矩形的面积表示连续性随机变量次数分布的图形。 直方图一般用纵轴表示数据的次数(频数),横轴表示数据的等距分组点(即各分组区间的下限)。在制作直方图时,以组距为底边,以分组区间的精确上下限为底边二端点,以次数为高画矩形,各直条矩形之间不留空隙,没有间隔(参见教材图23)。也可以不画矩形,只要使直方图包围的面积成封闭的图形即可,这种图又叫组织图(参见教材图24)。,次数多边形图,次数多边形图是表示连续性随机变量次数分布的线性图。 绘制次数多边形图时,横坐标是以各分组区间组中值表示的连续变量,纵坐标是数据的频数。以每个分组区间的组中值为横坐标,以各组的次数为纵坐标标点,连接各点,就成为一条折线(参见教材图25)。 多边形图与直方图虽然都是以面积表示表示连续性数据的次数分布,但次数多边形对次数的轮廓显示得更好,组与组之间的次数过渡是连续而直接的。如果样本很大,能描绘出一条分布曲线,还可据此找到次数分布的经验公式。这样就能够对于总体的理论次数分布的分析提供很多有用的信息,累加次数分布图,(1)累加直方图 这种图的横坐标同直方图一样,标以分组区间,纵坐标是累加次数,其余步骤同绘制直方图的要求一样(参见教材图27)。 (2)累加曲线(又称递加线) 它的画法同次数多边形基本相同,不同点是横坐标为每分组区间的精确上限或下限,纵坐标是各分组的累加次数,分别标出各个交点,连接各交点即可画成累加曲线。如果有累加直方图,连接各组矩形的右顶点可画累加曲线(参见教材图28)。,其他常用的统计表的类型,(1)简单表 只列出名称、地点时序或统计指标名称的统计表。 (2)分组表(单向表) 只有一个分类标志分组的统计表。 (3)复合表 统计分组的标志有两个或两个以上的表。,其他常用的统计图的类型,(1)条形图(直条图) 条形图主要用于表示离散型数据资料,它是以条形长短表示各事物间数量的大小与数量之间的差异情况。 (2)圆形图 圆形图主要用于描述间断性资料,目的为显示各部分在整体中所占的比重大小,以及各部分之间的比较。圆形图显示的资料多以相对数(如百分数)为主。 (3)线形图 线形图更多地用于连续资料,凡欲表示两个变量之间的函数关系,或描述某种现象在时间上的发展趋势,或一种现象随另一种现象变化的情形,用线性图表示是较好的方法。 (4)散点图 散点图是用相同大小圆点的多少或疏密表示统计资料数量的大小,以及变化趋势的图。通常以圆点的分布的形态表示两种现象间相关程度。,直方图、条形图、圆形图、线性图、散点图等这些常用的统计图,根据它们表现的作用和内容,把它们可分为哪几类?,思考题,根据它们表现的作用和内容,把它们可分为五类。第一种是表现分布的图,比如直方图。第二种是表现内容的图,如条形图和圆形图。第三种是表现变化的图,这种图形的代表是线性图。第四种是表现比较的图,这几种图形都能采用。第五种是表现相关的图,如散点图。,答:,第三章 集中量数,算术平均数 中数众数 其它集中量数(加权平均数、几何平均数、调和平均数等),集中量数的概念,集中量数就是对一组数据的集中趋势特点进行度量和描述的统计量。它反映了次数分布中大量数据向某方向集中的程度。 常用的集中量数有算术平均数、中数、众数 、加权平均数、几何平均数、调和平均数等。,算术平均数是所有观察值的总和除以总频数所得之商。用 表示。 若以 X1,X2,XN 表示变量 X 的各个观察值,N 表示观察值的个数,则算术平均数可表示为:,算术平均数的概念,(1)在一组数据中每个变量与平均数之差的总和等于0,即 。 (2)在一组数据中,每一个数都加上一常数C,则所得的平均数为原来的平均数加常数C,即 。 (3)在一组数据中,每一个数都乘以一常数C,则所得的平均数为原来的平均数乘以常数C,即 。,算术平均数的特点,(1)未分组数据(原始数据)计算法 (2)数据分组后(次数分布表)计算法 (式中 XC 为各区间的组中值,f 为各区间的次数),算术平均数的计算方法,算术平均数的优缺点,算术平均数具备一个良好的集中量数所应具备的一些条件: 反应灵敏; 严密确定; 简明易懂; 计算简单; 适合代数运算; 较少受抽样变动的影响。 除此之外,算术平均数还有以下一些特殊的优点: 只知一组观察值的总和及总频数就可以求出算术平均数; 用加权法可以求出几个平均数的总平均数; 用样本数据推断总体集中量数时,算术平均数最接近总体集中量数的真值,它是总体平均数的最好估计值; 在计算方差、标准差、相关系数以及进行统计推断时,都要用到它。 但是算术平均数也有一些缺点: 易受极端数据的影响; 若出现模糊不清的数据时,无法计算平均数。,算术平均数的意义、适用条件及应用原则,算术平均数的意义 算术平均数是应用最普遍的集中量数,它是“真值”渐近、最佳的估计值。 算术平均数的适用的条件 一组数据是比较准确,可靠又同质,而且需要每一个数据都加入计算,同时还要作进一步代数运算时,这时就需要用算术平均数表示其集中趋势。 计算和应用算术平均数的原则 同质性原则; 平均数与个体数值相结合的原则; 平均数与标准差、方差相结合的原则。,中数是按顺序排列在一起的一组数据中居于中间位置的数,即在这组数据中,有一半的数据比它大,有一半的数据比它小。中数用d 表示。,中数的概念,(1)一组数据中无重复数值的情况 指一组数据中没有相同的数,这时取处于序列中间位置的那个数为中数。如果数据个数为奇数,则中数为 位置的那个数;如果数据个数为偶数,则中数为居于中间位置两个数的平均数,即第 与第 位置的两个数据的平均数。 (2)一组数据中有重复数值的情况 指一组数据中有相同数值的数据,这时计算中数的方法基本与无重复数值的单列数据相同。但根据重复数值数据在该组数据中所处的位置又细分为以下两种情况: 当重复数值没有位于数列中间时,求中数的方法与无重复数据时求中数的方法相同。 当重复数目位于数列中间时,需要假设位于中间的几个重复数目为连续数目,取序列中上下各 那一点上的数值为中数。,未分组数据(原始数据)求中数的方法,将原始数据整理成次数分布表后,求中数的原理同重复数目求中数是一样的,也是取序列中将N平分为两半的那一点的值作为中数。 或 式中 为中数所在分组区间的精确下限, 为中数所在分组区间的精确上限, 为该组以下各组的累加次数, 为该组以上各组的累加次数, 为该组的次数。,数据分组后(次数分布表)求中数的方法,中数的意义与应用,中数的意义 中数虽然也具备一个良好集中量数所应具备的一些条件,如计算简单,严密确定,简明易懂;但与算术平均数相比是相形见绌的,如反应不够灵敏,受抽样的影响较大,不适合代数运算等。因此,在一般情况下,中数不被普遍应用,但在一些特殊情况下,它的应用受到重视。 中数适用的情况 (1)当一组观测结果中出现两极端数目时; (2)当次数分布的两端数据或个别数据不清楚时; (3)当需要快速估计一组数据的代表值时。,一项研究调查了19名大学生,他们的月消费(单位:人民币元)如下: 220,227,230,231,232,232,235,236, 237,239,240,245,246,249,253,258, 260,510,600现欲了解他们的平均月消费?,思考题,由于这19名大学生的月消费中存在极端数据,算术平均数(元)不能很好地反映他们的平均月消费(19人中17人月消费低于272.63元),应求中数: (元) 答:这些大学生的平均月消费是239元。,解:,众数有理论众数和粗略众数两种定义方法。理论众数是指与次数分布曲线最高点相对应的横坐标上的一点。粗略众数是指一组数据(或次数分布)中次数出现最多的那个数的数值。众数用 表示。,众数的概念,(1)用观察法直接寻找粗略众数在一组原始数据中,次数出现最多的那个数值就是众数;在次数分布表中,次数最多一组的组中值就是粗略众数。 (2)用经验公式求理论众数的近似值 皮尔逊经验法 (适合正态分布) 金氏插补法 (适合偏态分布) 其中为含众数这一区间的精确下限,为高于众数所在组一个组距那一分组区间的次数,为低于众数所在组一个组距那一分组区间的次数。,众数的计算方法,众数的意义与应用,众数的意义众数虽然简明易懂,较少受两极端数值的影响,但它并不具备一个良好集中量数的基本条件。如极不准确、稳定,反应不灵敏,不适合代数运算,受抽样的影响较大等。因此,在一般情况下,众数应用也不广泛,但在一些特殊情况下也常有应用。 众数适用的情况(1)当需要快速而粗略地寻求一组数据的代表值时;(2)当一组数据出现不同质的情况时;(3)当次数分布中有两极端的数目时;(4)当粗略估计次数分布的形态时。,学校要召开运动会,决定从高一年级8个班中抽调40名男生组成一个整齐的彩旗方阵队,如果从高一(1)班的体检表中任意抽出10份男生表格,得到10个男同学的身高(单位:米)如下: 1.63 1.60 1.68 1.66 1.66 1.63 1.75 1.66 1.58 1.65请根据这10个身高值提供的信息确定参加方队学生的最佳身高值应取多少?并说明理由。,思考题,参加方队学生的最佳身高值应取1.66。这是因为从这10个身高值可以看出,1.66出现的次数最多,是这组数的众数,既然这10个男生中有3个身高为1.66米,而一个班远不止10个男生,那么8个班的男生中应该能选出40名这种身高的人。,答:,(1)当次数分布呈正态时:(2)当次数分布呈正偏态时: 且(3)当次数分布呈负偏态时: 且,算术平均数、中数、众数之间的关系,加权平均数的概念加权平均数是不同比重数据(或平均数)的平均数,用表示。 加权平均数的计算方法 式中为权数 加权平均数的应用当测量所得的数据,其单位权重并不相等时,要用加权平均数来求平均数。,加权平均数,几何平均数的概念 几何平均数是N个数值连乘积的N次方根,用 表示。 几何平均数的计算方法 几何平均数的应用 (1)直接应用公式计算几何平均数 当一组实验数据中有少数数据偏大或偏小,数据的分布呈偏态时,要用几何平均数作为集中趋势的代表。 (2)应用几何平均数的变式计算 当一组数据彼此间变异较大,几乎是按一定的比例关系变化时,要用几何平均数计算平均比率。,几何平均数,调和平均数的概念 调和平均数(倒数平均数)是一组数据倒数的算术平均数的倒数,用 表示。 调和平均数的计算方法 调和平均数的应用 调和平均数在心理与教育研究方面的应用,主要是用以描述学习速度方面的问题。,调和平均数,第四章 差异量数,全距与百分位差 平均差、方差与标准差 标准差的应用 差异量数的选用,差异量数的概念,差异量数就是对一组数据的变异性(离中趋势)特点进行度量和描述的统计量。它反映了次数分布中数据彼此分散的程度。 常用的差异量数有全距、四分位差、百分位差、平均差、标准差与方差等等。,为什么要引入差异量数来描述一组数据的特征?,思考题,在教育研究中,要全面描述数据的特征,不但要了解数据的典型情况,而且还要了解特殊情况。这些特殊性常表现为数据的变异性。因此,只有集中量数不可能真实地反映它们的分布情况。为了全面反映数据的总体情况,除了使用集中量数外,还需要引入差异量数。,答:,全距,全距的概念 全距是一组数据中最大值与最小值之差。全距用R表示。 全距的计算方法 原始数据的全距是最大值与最小值之差。 次数分布表的全距一般是最大一组与最小一组的组中值之差,或者是最大一组上限与最小一组下限之差 全距的意义与应用 全距概念清楚,意义明确,计算简单,但它仅由最大值与最小值而求得,易受两极端数值影响。不考虑中间数值的差异,它反应不灵敏,因此,它只是一种低效的差异量数。它的用处一般只用于研究的预备阶段,用它检查数据的大概散布范围,以便确定如何进行统计分组。,百分位数的概念百分位数是位于依一定顺序排列的一组数据中某一百分位置的数值。百分位数一般用 表示。 百分位数的计算方法 这里 表示百分位数所在组的精确下限, 表示小于 的各组次数的和。,百分位数,百分等级的概念百分等级是指表示某一分数在整个分数分布中所处的百分位置。百分等级用表示。 百分等级的计算方法 这里 表示该分数所在组的精确下限, 表示小于的各组次数的和。,百分等级,百分位差的概念和计算 百分位差是指两个百分位数之差。 常用的百分位距有两种:一为第90与第10百分位数之差,用 表示。一为第93与第7百分位数之差,用 表示。 百分位差的意义与应用 百分位差与全距相比,虽然少受两极端数值的影响,但仍然不能很好地反映中间数据的散布情况,因此只作为主要差异量的补助量数,在实践中很少使用。,百分位差,四分位差的概念 四分位差是指在一个次数分布中,中间50%的次数的全距的一半。四分位差用Q表示。 四分位差的计算方法 (1)未分组数据(原始数据)计算法 其中 (第25百分位数)与 (第75百分位数)求法可参照原始数据中位数的计算方法。 (2)数据分组后(次数分布表)计算法 其中这里表示百分位数所在组的精确下限,表示小于的各组次数的和, 表示百分位数所在组的次数;,四分位差(一),四分位差 ( 二),四分位差的意义四分位差简明易懂,计算简便,较少受两极端数值的影响,比全距可靠得多。但它忽略了左右共50%数据的差异,又不适合代数运算,反应不够灵敏,因而也限制了它的应用,它通常与中数联系起来共同应用。 四分位差适用的情况有特大或特小两极端数值,有个别数值不确切、不清楚,以及用等级表示的数据等情况。,动差是指力与力点与原点之间距离的乘积。 统计学用此概念表示次数分布的离散情况。它把各组次数当做力学上的力,用数值(或组中值)与原点之差作为距离来计算动差,并且把以平均数为原点的动差叫做中心动差。常见的中心动差有: 一级动差 二级动差 ( 是表示一个分布中离中趋势的指标) 三级动差 ( 是表示一个分布中偏斜度或偏态性的指标) 四级动差 ( 是表示一个分布中峰态性的指标),动差体系,平均差的概念 平均差是指次数分布中所有原始数据与平均数绝对离差的平均值。平均差用A.D.表示。 平均差的计算方法 (1)未分组数据(原始数据)计算法 (2)数据分组后(次数分布表)计算法 平均差意义 平均差意义明确,计算容易,反应灵敏,较好地代表了数据分布的离散程度。但它计算要用绝对值,不利于进一步做统计分析,应用受到了限制,属于一种低效差异量数。,平均差,方差是指离均差(即每个数据与该组平均数之差)平方的算术平均数。用 表示。标准差是指方差的算术平方根,用 表示。,方差与标准差的概念,(1)未分组数据(原始数据)计算法 基本公式: 变式公式: (2)数据分组后(次数分布表)计算法 基本公式: 变式公式: 或 式中 (AM为估计平均数),方差与标准差的计算方法,由于方差、标准具有可加性,在已知几个小组的方差或标准差的情况下,可以计算出几个小组联合在一起的总的方差或标准差。 计算总方差和总标准差的公式如下: 式中 , 为总平均数,为各小组的平均数,总标准差的的合成,方差与标准差的性质 (1)每一个观察值都加一个相同常数C之后,计算得到的标准差等于原标准差。即如果 ,则有 。 (2)每一个观察值都乘以一个相同常数C,则所得的标准差等于原标准差乘以这个常数。即若,则有 。 (3)每一个观察值都乘以一个相同常数C( ),再加一个常数d,所得的标准差等于原标准差乘以这个常数。即若( ),则有 。 方差与标准差的意义方差与标准差是表示一组数据离散程度的最好的指标。它们是描述统计与统计推断分析中最常用的差异量数。 标准差基本具备一个良好的差异量数应具备的条件: 反应灵敏; 严密确定; 容易计算; 适合代数运算; 受抽样变动的影响小; 简单明了。标准差与其他各种差异量数相比,具有数学上的优越性,特别是当已知一组数据的平均数与标准差后,就可以知道落在平均数上下各一个标准差、两个标准差,或三个标准差范围之内的数据所占的百分比。,方差与标准差的性质和意义,思考题,为什么说标准差是重要而完善的差异量?,(1)标准差具有简单明了,反映灵敏,严密确定,容易计算,适合代数运算,受抽样变动的影响较少等优点。 (2)标准差在避免两极端数值影响方面大大超过全距、百分位差和四分位差;在避免绝对值方面,优于平均差;在考虑单位方面,优于方差。,答,差异系数的概念 差异系数是指标准差与其算术平均数的百分比,用CV表示。其计算公式如下: 差异系数的应用 (1)同一团体不同观测值离散程度的比较(即不同单位资料差异程度的比较); (2) 对于水平相差较大,但进行的是一种观测的各种团体,进行观测值离散程度的比较(即单位相同而平均数相差较大的两组资料差异程度的比较)。 在应用差异系数比较相对差异大小时,应注意以下几点: 测量的数据要保证具有等距尺度; 观测工具应具备绝对零; 差异系数只能用于一般的相对差异量的描述,至今尚无有效的假设检验方法。,差异系数,标准分数的概念 标准分数是以标准差为单位表示一个分数在团体中所处位置的相对位置量数。 标准分数的计算方法 标准分数的性质 (1)Z 分数无实际单位,是以平均数为参照点,以标准差为单位的一个相对量。 (2)一组原始分数转换得到的Z 分数可以是正值,也可以是负值。 (3)一组原始分数中,各个Z 分数的标准差为1,即。 (4)若原始分数呈正态分布,则转换得到的所有Z 分数值的均值为0,标准差为1的标准正态分布。 标准分数的优点 (1)可比性; (2

    注意事项

    本文(教育统计学ppt课件.ppt)为本站会员(小飞机)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开