欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > DOCX文档下载  

    教育统计学 笔记公式.docx

    • 资源ID:3111010       资源大小:55.24KB        全文页数:55页
    • 资源格式: DOCX        下载积分:6.99金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要6.99金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    教育统计学 笔记公式.docx

    教育统计学 笔记公式教育统计学 第一章 绪论 王孝玲 教育统计学是运用数理统计的原理和方法研究教育问题的一门应用科学。它的主要任务是研究如何搜集、整理、分析由教育调查和教育实验等途径所获得的数字资料,并以此为依据,进行科学推断,从而揭示蕴含在教育现象中的客观规律。 统计学和教育统计学的内容:从具体应用角度来分,可以分成:描述统计、推断和实验设计三部分。 描述统计:对已获得的数据进行整理、概括,显现其分布特征的统计方法。通过教育调查和教育实验获得了大量的数据,用归组、编表、绘图等统计方法对这进行归纳、整理,以直观形象的形式反映其分布特征;通过计算各种特征量,来反映它们分布上的数字特征。 推断统计:根据样本所提供的信息,运用概率的理论进行分析、论证,在一定可靠程度上对总体分布特征进行估计、推测。 描述统计是推断统计的基础,推断统计是通过样本信息估计、推测总体,从已知情况估计、推测未知情况。 学习统计学和教育统计的学的意义:一、统计学为科学研究提供了一种科学方法,统计推理的方法是归纳法。二、教育统计学是教育科研定量分析的重要工具。三、广大教育工作者学习教育统计学的具体意义:1、可以顺利地阅读运用统计方法进行定量分析的科研报告。2、可以提高教育工作的科学性和效率。3、为学习教育测量及教育评价打下基础。 随机现象:1、一次试验有多种可能结果,其所有可能 结果是已知的;2、试验之前不能预料哪一种可能结果会出现;3、在相同的条件下可以重复试验。 随机现象的每一种结果叫做一个随机事件。 总体:研究的具有某种共同特性的个体的总和。总体中的每个单位称为个体。样本是从总体中抽取的作为观察对象的一部分个体。 样本上的数字特征是统计量。总体上的各种数字特征是参数。在进行统计推断时,就是根据样本统计量来推断总体相应的参数。 第二章 数据的初步整理 教育统计资料的来源:经常性资料、专题性资料 数据的种类:按来源分:点计数据和度量数据,按随机变量取值情况分:间断型和连续型随机变量。 数据的统计分类:按照研究对象的本质特征,根据分析研究的目的、任务,以及统计分析时所用统计方法的可能性,将所获得的数据进行分组归类。分类标志按形式划分:性质类别和数量类别。 统计表:一般由标题、表号、标目、线条、数字、表注构成。分复合表、简单表、分组表。某一个随机事件在n次试验中出现的次数称为随机事件的频数。 简单频数分布表:求全距、决定组数和组距、决定组限、登记频数。 统计图:表示间断变量的统计图:直条图、圆形图。表示连续变量的统计图:线形图、频数分布图 第三章 集中量:是代表一组数据典型水平或集中趋势的量。 算术平均数:算术平均数是所有观察值的总和除以总频数所得之商,它是统计学中最易理解最常应用的一种集中量指标。特性:观察值的总和等于算术平均数的n倍,各观察值与其算术平均数之差的总和等于0,若一组观察值是由两部分或几部分组成,这组观察值的算术平均数可以由组成部分的算术平均数而求得。优缺点:1、反应灵敏。2、严密确定3、简明易懂,计算简单4、适合代数运算5、只知一组观察值的总和及总频数就可以求出算术平均数。6、用加权法可以求出几个平均数的总平均数。7、用样本数据推断总体集中量时,算术平均数最接近于总体集中量的真值,它是总体平均数的最好估计值。8、在计算方差、标准差、相关系数以及进行统计推断时,都要用到它。 缺点是:易受两极端数值的影响。一组数据中某个数值大小模糊不清或不够确切时,就无法计算。它所适用 的条件:一组数据中每个数据都比较准确可靠;无两极端数值影响;而且还要通过它计算其他统计量。 中位数是位于依一定大小顺序的一组数据中央位置的数值。各有一半数的一级数据的数据个数一分为二的数值。是百分位数的一种。 百分位数是位于依一定顺序排列的一组数据中某一百分位置的数值。 中位数的应用及其优缺点:不适合代数计算,与算术平均数相比抽样偏差相对较大。很少受两极端数值的影响,由数据的个数所决定,反应不灵敏,适用于:1、一组数据有特大或特小两极端数值时2、一组数据中有个别数据不确切、不清楚时。3、资料属于等级性质时。 第三节 众数 皮尔逊经验法:M0»3Md-2X。 众数的应用及其优缺点:随频数分布表上的组距变化而变化,极不准确、极不稳定。不适合代数计算,受抽样变动较大,较少受两极端数值的影响,反应不灵敏。使用条件:1、当需要快速而又粗略地找出一组数据的代表值时2、当需要利用 算术平均数、中位数、众数三者关系来粗略地判断频数分布的形态时3、利用众数帮助分析解释一组频数分布是否确实具有两个频数最多的集中点时。 当一个频数分布出现两个频数最多一组时,可以通过合并组距的方法视其资料的同质性。若合并后仍有两个集中点,则表明这组数据是由两种性质不同资料混合在一起。 算术平均数、中位数、众数三者关系:当频数分布呈正态时,三者合为一点:X=M当频数分布呈正偏态时,X>Md>M0d=M0;,负偏态时:X<Md<M0加权平均数 几何平均数 调和平均数 加权平均数是不同比重数据或平均的平均数。 几何平均数:n个数值连乘积的n次方根。当一个数列的后一个数据是以前一个数据为基础成比率增长时,要用它求其平均增长率,常用作速率的集中量,在教育方面,求增加率、进步率等。求法是n个数据连乘积的n次方根。Xg=nX1X2Xn调和平均数:是一组数据倒数的算术平均数的倒数。主要是用来求学习速度。 XH=11æ111ç+çnèX1X2Xnö÷÷ø第四章 差异量 表示一组数据变异程度或离散程度的量叫差异量。差异量大大,表示数据分布越广,越不整齐、差异量越小,表示数据分布得越集中,变动范围越小,绝对差异量,相对差异量 全距是一组数据中最大值与最小值之差。 四分位距是用依一定顺序排列的一组数据中间部位50%个频数距离的一半作为差异量指标。QD=Q3-Q12 四分位距的应用及其优缺点:简明易懂,计算简便,较少受两极端数值的影响,比全距可靠的多。但它忽略了左右共50%数据的差异,不适合代数运算。当一组数据中用中位数表示集中量时,就要用四分位距表示差异量。 第二节 平均差 每一个数据与该组数据的中位数或算术平均数离差的绝对值的算术平均数。MD=åX-Mdn第三节 方差和标准差 方差是指离差平方的算术平均数,一组数据中每个数据与该组平均数之差,平方之求其和,再除以数据的个数。s平方根sX2X=å(X-Xn)2标准差即方差的=åXn2æ-ççèåXö÷÷nø2 优点:反应灵敏,随任何一个数据的变化而变化,严密确定,一组数据的方差及标准差有确定的值,计算简单,适合代数运算,可以将几个方差和标准差综合成一个总的方差和标准差,用样本数据推断总体差异量时,方差和标准差是最好的估计量。在避免两极端数值影响方面超过全距,在考虑到全部离差方面,优于四分位距,在避免绝对值方面优于平均差。缺点是不太容易理解,易受两极端的影响,有个别数值糊涂不清时无法计算。最直接的用途是描述一组数据的离散程度。 第四节 相对差异量 对两种单位不同或单位相同而两个平均数相差较大的资料进行差异大小的比较。CV偏态量及峰态量:SK=sXX´100%=3(X-MdX-M0sSK),SK=0 时,分布呈对称形, SK3>0 正偏XsX态 SK<0负偏态。 偏态系数:a峰, a>0高狭峰 a<0低阔峰 å(X3-Xn3)= 峰态量 aå(X4-Xn4)4=sXs a=0时呈正态X第五章 概率及概率分布 以随机事件在大重复试验中出现的稳定频率值作为随机事件概率的估计值,这样寻得的概率称为后验概率。 先验概率是在特定条件下直接计算出来的,是随机事件的真实概率,不是由频率估计出来的。 概率的性质:任何随机事件的概率都是在0与1之间0£不可能事件的概率等于0,必然事件的概率等于1 第二节 二项分布 凡满足以下条件的试验称为二项试验: 一次试验只有两种可能结果,即成功和失败,各次试验相互独立,即各次试验之间互不影响。各次试验中成功的概率相等,各次试验中失败的概率也相等。二项分布是一种离散型随机变量的概率分布。 二项分布函数:PXP£1=CnXpqXn-X=n!X!(n-X)!pqXn-X 二项分布的平均数和标准差:当二项分=np布接近正态分布时,在n次二项试验中成功事件出现次数的平均数为m为s=npq标准差,二项分布的应用:除了用来求成功事件恰好出现X次的概率之外,在教育中主要用来判断试验结果的机遇性与真实性的界限。 正态分布是一种连续型随机变量概率分布。正态曲线的函数:Y正态曲线的特点:曲线在Z处为最高点。曲线以Z处为中心双侧对称。曲线最高点向左右缓慢下降,并无限伸延,但永不与基线相交。标准正态分布上的平均数为标准差为,基线上Z从至+,个标准差距离间几乎包含了全部面积,曲线从最高点向左右延伸时,在正负个标准差之内既向下又向内弯,正负个标准差开始,既向下又向外弯。 正态曲线在测验记分方面的应用:1、将原始分数转换成标准分数。标准分数的优点:各科标准分数的单位是绝对等价的;标准分数的数值大小和正负,可以反映某一考分在团体中所处的位置;确定录取分数线;确定等级人数;品质评定数量化。 第六章 抽样分布及总体平均数推断 平均数抽样分布的几个定理:1、从总体中随机抽出容量为n的一切可能样本的平均数之平均数等于总体平均数2、容量为n的平均数在抽样分布上的标准差,等于总体标准差除以n的平方根。sX=sn 3、从服从正态分布的总体中,随机抽取的容量为n的一切可能样本平均数的分布也呈正态分布。4、虽然总体不呈正态分布,如果样本容量较大,反映总体m和s的样本平均数的抽样分布也接近于正态分布。当总体标准差为已知时,平均数抽样分布的标准差与样本容量n的平方根成反比,即样本容量越大,平均数抽样分布的标准差越小,当样本容量n确定时,平均数抽样分布标准差与总体标准差成正比,即总体数值离差程度越大,平均数抽样分布的标准差越大。抽样分布是统计推断的理论依据。某种统计量在抽样分布上的标准差称为该种统计量的标准误。标准误越小,表明样本统计量与总体参数的值越接近,样本对总体越有代表性,用样本统计量推断总体参数的可靠度越大,所以标准误是统计推断可靠性的指标。 样本平均数与总体平均数离差统计量的形态:Z=X-ms=X-mXsnt分布与正态分布的相似之处:t分布基线上的t值从-¥+¥;从平均数等于处,左侧t值为正;曲线以平均数处为最高向两侧逐渐下降,尾部无限伸延,永不与基线相接,呈单峰对称形。区别之处在于:t分布形态随自由度的变化呈一簇分布形态,t分布的峰镲尖峭,尾长而翘得高,在基线上分布的范围广,自由度越小,分布范围越广。当自由度逐渐增大时,t分布逐渐接近正态分布。当自由度趋于无限大时,t分布与正态分布重合。 第二节 总体平均数的估计 根据样本信息对总体参数的有两种不同形式:总体参数估计和假设检验。 总体参数估计的基本原理:根据样本统计量对相应总体参数所作的估计叫总体参数估计,分为点估计和区间估计。当用某一样本统计量的值来估计相应总体参数的值叫点估计。以样本统计量的抽样分布为理论依据,按一定概率要求,由样本统计量的值估计总体参数值的所在范围。 ssöæ区间估计:pçX-1.96<m<X+1.96÷=0.95 nnøèsXsXöæpçX-t(df)0.05<m<X+t(df)0.05÷=0.95n-1n-1øè第三节 假设检验的基本原理 利用样本信息,根据一定概率,对总体参数或分布的某一假设作出气绝或保留的决断,称为假设检验。 零假设是关于当前样本所属的总体与假设总体无区别的假设。 备择假设是与零假设相反的假设,是研究者根据样本信息期待证实的假设,是根据样本信息否定了零假设时,应当采取的假设。统计推理采用的是反证法。 小概率事件:样本统计量的值在其抽样分布上出现的概率小于或等于事先规定的水平。显著性水平:统计学中把拒绝零假设的概率。显著性水平越高,越不容易拒绝零假设,推断的可能性就越大。 统计决断的两类错误及其控制:第一类错误:假设真实而被拒绝,第二类错误:假设属伪而被保留。第一类错误的控制通过选择适当的显著性水平加以主动控制。后果非常严重的用较高的显著性水平,0.01 0.005,当拒绝一个属真的假设其后果不是严重的,选用较低的显著性水平 0.05 0.1。控制第二类错误的概率的方法:利用已知的实际总体参数值与假设参数值之间大小关系,合理安排拒绝区域的位置。2、使样本容量增大。 总体平均数的显著性检验 H0 H:m£1:m> 右侧检验 Z=X-mt=snX-msXn-1第七章 平均数差异的显著性检验 本章是根据两个样本平均数之差检验两个相应总体平均数之差的显著性。根据两个样本统计量的差异检验两个相应总体参数差异的显著性,统计学上称为差异显著性检验。 相关样本平均数差异的显著性检验:两个样本内个体之间存在着一一对应关系,这两个样本称为相关样本,分为两种情况:配对组和对照组。小样本t=X1-X2S1+S2-2rS1S2n=X1-X2s1+s2-2rs1s2n-122大样本:用Z检验,公式同上。 Z=X121独立样本平均数差异的显著性检验:大样本:-X+222ssn1n2独立小样本:t=X1-Xn1s1+n2s2222n1+n2n1n2X1-XS1222n1+n2-2·独立小样本方差不齐性时差异显著性检验:t¢=2æS12öS2×t+×t(df2)0.05ç÷çn1÷(df1)0.05n2èø=X1-X2n1+S2s12n2n1-1+s22n2-1t¢(0.05)=S12n1+S22n2方差齐性检验:对两个总体的方差是否有显著性差异所进行的检验。 两个独立样本的方差齐性检验:H:s1=s22220 H221:s1¹s222F=S1S222n1s1=ns222(n12-1)-1)(n2t=s1-s4s1s222两个相关样本的方差齐性检验:(1-r)2n-2第八章 方差分析 基本原理:方差分析的目的:平均数差异的显著性检验,是对两个平均数的比较,在比较多组平均数的时候,常用方差分析综合性地确定几个平均数差异的显著性。方差分析的功能就在于对多组平均数差异的显著性进行检验 方差分析中的几个概念:实验中的自变量称为因素。只有一个自变量的实验称为单因素实验。有两个或两个以上自变量的实验称为多因素实验。某一个因素的不同情况称为因素的水平,包括量差或质别两类情况,按各个水平条件进行的重复实验称为各种处理。假如要研究两种教材及三种教学法对学生学习成绩的影响,该实验是双因素的实验。一个因素是教材,它有两种水平,另一个因素是教学方法,它有三种水平。这个实验称为2*3的实验设计,共有6种处理,若一个实验为2*2*2设计,则表示该实验有三个因素,每个因素有两种水平,共有8种处理。 用方差分析法检验某一因素对因变量的作用,称为单因素方差分析。 完全随机设计的方差分析:为了检验某一个因素多种不同水平间差异的显著性,将从同一个总体中随机抽取的被试,再随机地分入各实验组,施以各种不同实验处理之后,用方差分析法对这多个独立样本平均数差异的显著性进行检验,称为完全随机设计的方差分析。 1、n相等的情况: 组间平方和:SSb组内平方和:SS(åX)(ååX) =å-22nnKW=ååX2X2(åX) -å2n总平方和:SSt=ååb(ååX)-nK2组间自由度:df组内自由度:df=K-1w=n1+n2+.-K总自由度:dfMSt=K(n-1)=MSbMSWSSb=SSbdfbSSWdfW F Fb=dfbdfWMSW=SSW二、n不相等 组间平方和:SS组内平方和:SS总平方和: SSdfW=n1+n2+.-Kb=å(åXn)2(ååX)-ån-2W=ååX2å(åXn) 22t=ååtX2-(ååX) ån df=n1+n2.-1dfb=K-1用n X S s进行组间与组内方差的F检验 Xt=ånXån221 SSb=n1(X1-Xt)+n2(X2-Xt).+nK(XK-Xt) SSW=n1s2xdfW=n1+n2+.+nK dfb=K-1 SSF=SSb+n2s2x2.+nsxKdfdfbWW对多组平均数每对之间的差异进行多重比较的方法,q检验法最为常用。 1、各组n相等:q=X1-XW2ö÷÷øMSn2、各组n不相等:q=MS2X1-XW2æ11ç+çnn2è1第三节 随机区组的设计的方差分析 在检验某一因素多种不同水平之间差异的显著性时,为了减少被试间个别差异对结果的影响,把从同一个总体中抽取的被试按条件相同的原则分成各个组,使每个区组内的被试尽量保持同质。在对各区组施以多种实验处理之后,用方差分析法对这多个相关样本平均数差异所进行的显著性检验,称之为随机区组设计的方差分析。 每一区组内被试的人数分配有以下三种方式: 1、一个被试作为一个区组,所有的被试都要分别接受各种实验处理。 2、每一区组内的被试的人数是实验处理数的整数倍数。 3、区组内不是以个别被试为基本单元,而是以一个团体为一个基本单元。 完全随机区组设计的方差分析 计算平方和:组内平方和解成区组平方和及误差平方和SSW=SSr+SSe 总平方和可分解成组间平方和、区组平方和及误差平方和: SSt=SSb+SSr+SSe=ååX2(ååX) -2nK组间平方和:SSb(åX)(ååX)=å- 22nnK区组平方和:SSr=å计算方差: 组间方差:MSb=SSbdfb=(åR)K2(ååR)- 2nK 区组方差:MSr误差方差:MSe计算F值:F=SSrdfr=SSedfeMSbMSb区组差异显著性检验: 计算检验统计量的F值:F=MSrMSe第五节 多组方差的齐性检验 哈特莱提出的最大F值检验法进行齐性检验。F=SS22maxminS=åX2-n-1(åX)20提出假设:HH1=sA=sB=sC:至少有两个总体方差不相等 当各组n不相等时可用容量最大一组n计算自由度。 第九章 总体比率的推断 总体平均数、方差的统计推断都是对由测量而获得的、正态连续变量的数据所进行的统计推断。对点计数据的统计推断应采用总体比率的推断方法或c2检验。 比率的抽样分布是二项分布。二项概率分布是进行总体比率统计推断的理论依据。总体比率标准误的估计量为SP=pqn第二节 总体比率的区间估计 Z=p-p¢pqnépqpqù¢pêp-2.58<p<p+2.5ú=0.99nnëûp-p¢p¢q¢n第三节 总体比率的假设检验 一个样本总体比率假设检验:Z=p¢总体比率 q¢1-p¢ p为样本比率 两个独立样本比率差异的显著性检验: Z=p1-p2(n1p1+n2p2)(n1q1+n2q2)n1n2(n1+n2)p1-p2nc1nc2n1n2两个相关样本比率差异的显著性检验:Z第十章 c2检验 c2=b-cb+c及其分布 c2检验的特点:对样本的频数分布所来自的总体分布是否服从某种理念分布或某种假设分布所作的假设检验,即根据样本的频数分布来推断总体的分布。它与测量数据的假设检验的不同在于:1、测量数据的假设检验,其数据属于连续变量,而c2检验的数据属于点计而来的间断变量。2、测量数据所来自的总体要求呈正态分布,而c2检验的数据所来自的总体分布是未知的。3、测量数据的假设检验是对总体参数或几个总体参数之差所进行的假设检验;c2检验在多数情况下不是对2总体参数的检验,而是对总体分布的假设检验。 c检验属于自由分布的非参数检验。比率和比率之差的假设检验,是对二项分布数据的假设检验。处理的是一个因素分成两个类别,或是两个因素,第个因素都分为两个类别的资料 ,它最多只能同时比较两组比率的差异。而c2检验可以同时处理一个因素分为多种类别,或多种因素各有多种类别的资料。所以,凡是可以应用 比率进行检验的资料,都可以应用c2检验。 一、c检验统计量:c22=å(f0-ftft)2c2特点:1、具有可加性。2、c2值永远是正值。3、c2值大小 随实际频数与理论频数差的大小而变化。 单向表的c2检验 一个自由度的c2检验: 1、各组ft2、某组ft³5的情况:c2=åå(f0-ftft)22£5的情况:c2=(/f0-ft/-0.5)ft双向表的c2检验:把实得的点计数据按两种分类标准编制成的表就是双向表。在双向表c2检验中,如果要判断两种分类特征,即两个因素之间是否有依从关系,这种c2检验称为独立性c2检验。在双向表c2检验中,如果是判断几次重复实验的结果是否相同,这种c2检验称为同质性检验。 第三节 四格表的c2检验:1、c2=(ad-bc)2N(a+b)(a+c)(b+d)(c+d)2Nöæ/ad-bc/-ç÷N2ø当df=1,N<30或N<50时,进行亚茨连续性校正:c2=è (a+b)(a+c)(b+d)(c+d)第四节 相关样本四格表的c检验:1、c22=(b-c)2b+c2、若(b+c)<30或(b+c)<50 时, c2=(/b-c/-1)2b+c第十一章 相关分析 第一节 相关的意义 正相关:两个变量的变化方向一一致。负相关:两个变量 的变化方向相反。零相关:两上个变量值变化方向无一定规律。从密切程度来看,无论两个变量的变化方向是否一致,凡密切程度高的称为强相关,一笛膜的为中度相关,弱的为弱相关或低度相关。用来描述两个变量相互之间变化方向及密切程度的数字特征量称为相关系数。r 第二节 积差相关:当两个变量都是连续变量,而且两者之间呈线性关系时,表示这两个变量之间相关。使用条件是:1、两个变量都是由测量获得的连续性数据。2、两个变量的总体都呈正态分布,或接近正态分布,至少是单峰对称。3、必须是成对数据,而且每对数据之间相互独立。4、两个变量之间呈线性关系。5、要排除共变因素的影响。6、样本容量n³30。 积差相关系数:两个变量标准分数乘积之和除以n所得之商。r=åçæx-xöæy-y÷ççèsxøèsynö÷÷ø相关系数的等距转换及其合并:相关系数不可以直接相加求和,因为它不具有等距的单位。1、将各相关系数r转换成Zr 2、求Zr的平均数相关系数显著性检验的步骤及方法: 一、H0:r=0条件下, Zr=å(n-3)Zå(n-3) r1、n³50 r的抽样分布接近于正态分布 H0:r n£50 t=rn-21-r2=0 H0¹r Z=rn-11-r2将r转换成Zr Z=(Zr-Zr)n-3=2、 Ho:r=r0条件下 二、两个相对独立的样本相关系数差异的显著性检验ZZr1-Zr21n1-3+1n2-3第三节 等级相关:指以等级次序或以等级次序表示的变量之间的相关。主要包括斯皮尔曼二列相关及肯德尔和谐系数。 斯皮尔曼等级相关:当两个变量值以次序或以等级次序表示时,两个相应总体并不一定呈正态分布,样本容量也不一定大于30,表示这两变量之间的相关称为等级相关。虽然X变量可视为正态连续变量,但Y变量是按某种标准评定的等级,故rR=1-n(n-1)26åD21、赋预等级。2、计算两个变量每对所赋予的等级数之差D,及差数的平方之和,即åD2 检验方法:t=rn-21-r2肯德尔和谐系数:当多个变量值以等级次序排列或以等级次序表示,描述这向个变量之间的一致性程度的量。它常用来表示几个评定者对同一组学生学习成绩等级评定的一致性程度,或同一个评定者对同一组学生的学习成绩用等级先后评定多次之间的一致性程度。 无相同等级的情况: rw=SSR112K2(n3-n) SSR=åR2SSR112K2(R)-å2n2、有相同等级: rw=(n3-n-KåT) T=å(m 3-m/12) 相关系数的显著性检验:c2=K(n-1)rw第四节 质与量的相关:指一个变量为质,另一个变量为量,这两个变量之间的相关。主要包括二列相关、点二列相关、多系列相关。1、二列相关:当两个变量 都是正态连续变量,其中一个变量被人为地划分成二分变量。使用条件:1、两个变量都是连续变量,且总体呈正态分布,或接近正态分布,至少是单峰对称分布。2、两个变量之间是线性关系。3、二分变量是人为划分的,其分界点应尽量靠近中值。4、样本容量应当大于80。 二列相关系数的计算:rb=xp-xqpqstY 检验:Z=rb1Ypqn2、点二列相关:当两个变量其中一个是正态连续变量,另一个是真正的二分名义变量,有时一个变量虽然并非真正的二分变量,而是双峰分布的变量。 点二列相关系数:rpb=xp-xqpqst 检验:t=rn-21-r23、多系列相关:当两个变量都是正态连续变量,其中一个变量按不同质被人为地分成多种类别的正态名义变量。表示正态连续变量与多类正态名义变量之间的相关。 第五节 品质相关:两个变量都是按质划分成几种类别,数据一般是点计数据。根据两个变量的性质及所分类别的多少,分为四分相关,一、四分相关:当两个变量都是正态连续变量,且两者呈直线关系,但两者都被人æö0ç÷180rt=cosç÷ç1+ad÷bcøè为地划分成二分变量。 二、相关:当两个变量都是二分变量,无论是真正的二分变量还是人为的二分变量,这两个变量之间的关系,可以用相关来表示,比四分相关要广泛。rf=ab-bc(a+b)(a+c)(b+d)(c+d)=Nrf2检验:c2三、列联相关:当两个变量均被人为地分成两个以上类别,或其中一个变量被分成两个以上类别。c=df=(r-1)(c-1) c22N+c先求出 c2æöf0÷ 显著性检验:=Nç-1çånn÷rcèø第十二章 回归分析 相关表示两个变量之间的双向相互关系。回归表示一个变量随另一个变量 作不同程度变化的单向关系。由一个变量值估计、预测另一个变量值的准确性,随这两个变量之间的相关程度而变化。在存在相关的情况下,相关越高,由一个变量值预测另一个变量值越准确,误差越小。 第一节 一元线性回归指只有一个自变量的线性回归。 最小二乘方法求回归系数:在配制回归线时,回归系数的确定原则是使散布图上各点距回归线上相应点的纵向距离平方和为最小,这种求b的方法称为最小二乘方法。 求回归系数:由y估计x:b求截距:由x估计y:ayxxy=rssxy 由x估计y:byx=rssyx=y-byxx 由y估计x:axy=x-bxyy一元线性回归方程检验的方法:1、对回归方程进行方差分析。2、对两个变量的相关系数进行与总体零相关的显著性检验。3、对回归系数进行显著性检验。 检验步骤:1、提出假设:H0:0 H1:0 2、计算检验统计量:t=3、确定检验形式: 4、统计决断: 测定系数:r2byxsxn-21-r2由x估计y sy=-y)å(y x和y两个变量相关系数和平方等于回归平方和在总平方(y-y)å22和中所占的比率。 第三节 一元线性回归议程的应用:回归方程主要是用来由自变量的值估计预测因变量的值。这里的估计预测包含两个方面,一方面是用样本的回归方程推算因变量的回归值y ;另一方面是根据样本的回归值y估计预测因变量的真值y。多元线性回归是指有两个或两个以上自变量的线性回归。 第十三章 非参数检验 假设检验的方法有两种:参数检验根据样本的信息对相应的总体参数的假设检验。这种检验是以样本所属的总体呈正态分布,两个总体或几个总体方差齐性为假定条件。它适应于等距变量和比率变量的资料。非参数检验不仅适用于非正态总体名义变量和次序变量的资料,而且也适用于等距变量和比率变量的资料。它不需要对两个总体方差作齐性的假定,计算简单,适用于小样本资料。应用范围较参数检验广泛,但其灵敏性和精确度不如参数检验。 第一节 符号检验是通过 对两个相关样本的每对数据之差的符号进行检验,以比较这两个样本差异的显著性。1、小样本的情况:n<25时,可用查表法进行符号检验。 检验步骤: 1、提出假设:H0:P=P H1:PP 求差数,并记符号,较小的记为r,实际的r值越大于r的临界值,差异越不显著。 二、大样本的情况:当n>25时,二项分布接近于正态分布。检验步骤: 2、提出假设: 3、H0:P=P H1:PP (r±0.5)-Z=12nn2n当r>时,则r0.5,当r<时,r+0.5,r表示n+与 n-中数值较小的一个。 22n符号检验的优点是无须对所要检验的两个总体分布形态以及方差的齐性作任何假定,并且计算简单迅速,但是它只考虑符号的正负,不考虑差数数值的大小,因而失去了一部分样本所提供的信息。对于同一组数据,除小样本外,一般不采用符号检验。 第二节 符号秩次检验 为了克服符号检验的缺点,当比较两个相关样本的差异时,将两个样本每对数据差的绝对值从小到大排列,并赋予每一个差数以秩次,然后再给差数记上正负号。威尔科克逊 一、小样本:n<25时,可用查表法。 1、提出假设: 2、H0:P=P H1:PP 2、计算每对数值的差数,但先不记符号3、编秩次,差数为0不记,从小到大顺序4、记号:按差数的正负,给秩次记上+、号5、求秩次和,较小的一个用T表示。 二、大样本:n>25,二项分布接近于正态。 1、提出假设: H0:P=P H1:PP 2、计算每对数值的差数,但先不记符号3、编秩次,差数为0不记,从小到大顺序4、记号:按差数的正负,给秩次记上+、号5、求秩次和,较小的一个用T表示。 Z=T-UTsT=T-n(n+1)/4n(n+1)(2n+1)24第三节 秩和检验 当比较两个独立样本的差异时,可以采用曼惠特尼U检验法 一、小样本:当两个独立的样本容量n1与n2都小于10,并且n1n2时,可将两个样本的数据合在一起按数据从小到大的顺序给每一个数据编秩次。计算样本容量较小一组的秩次和,并用T表示。 二、大样本:当两个独立的样本容量n1与n2都大于10,T分布接近于正态。 1、提出假设: 2、H0:相同 H1:不相同 Z=T-UT2、将二者数字合在一起编秩次。3、求秩和 sT=T-n1(n1+n2+1)/2n1n2(n1+n2+1)12中位数检验:次序变量数据常以中位数作为集中量,以中分位距作为差异量。对两个或几个独立样本中位数的比较,可以采用非参数检验法。中位数的检验将各组样本数据合在一起找出共同的中位数,然后 分别计算每个样本在共同中位数上下的频数,再进行rc表X2 检验。 一、两个样本中位数的检验 1、提出假设: H0:相等 H1:不相等 2、求共同的中位数3、统计中位数上下的频数 4、计算X值:df=1,N<30可采用四格表缩减校正公式X22=2(a+b)(a+c)(b+d)(c+d)(/ad-bc/-N)N2统计决断: 二、多组中位数的检验:用3*2表的X2缩减公式检验 1、提出假设: H0:相等 H1:不相等 2、求共同的中位数3、统计中位数上下的频数4、计算X值:第五节 单向秩次方差分析 对于几个独立样本差异的显著性,可以用克鲁斯尔和沃利斯所提出的单向秩次方差分析进行检验。这种方法又称H检验法。它相当于对多组平均数所进行的参数的方差分析。它是用秩次进行的非参数的方差分析。 一、样本容量较小或组数较小的情况:当各组容量n5,或者样本组数K3,可用下式作为检验统计量。H=12N(N+1)2X2=N(åf0nrnc-1)åR2n-3(N+1) N表示各组频数总和,n表示每个小组频数总和.R表示每个组的秩次和(R1= R2= R3= ) 1、提出假设: H0:相等 H1:不相等 2、编秩次,求其和,分别计算各组的秩次和, 二、样本容量较大或组数较多的情况 当样本容量n>5或样本组数K>3时,可进行X检验(df=K1) 第六节 双向秩次方差分析:单向秩次方差分析是处理几个独立样本的资料,双向秩次方差,是处理几个相关样本的资料。 一、样本容量较小及实验次数较少的情况 当样本容量n9,K=3;n4,K=4时,用公式:X1、提出假设:H0:相等 H1:不相等 2、编秩次,求其和,分别计算各组的秩次和, 二样本容量较大或实验次数较多的情况 当K=3,n<9;K=4,n>4,或K>4时,X2r的抽样分布接近于df=K1的X2的分布。于是可以用X2近似处理:X2r2r2H=12N(N+1)åR2n

    注意事项

    本文(教育统计学 笔记公式.docx)为本站会员(小飞机)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开