教育统计学课件推断统计5-6章.ppt
《教育统计学课件推断统计5-6章.ppt》由会员分享,可在线阅读,更多相关《教育统计学课件推断统计5-6章.ppt(147页珍藏版)》请在三一办公上搜索。
1、,5.1 概率的一般概念,5.2 正态分布,第五章概率及概率分布,5.1 概率的一般概念,一 概率的定义1 先验概率的定义2 后验概率的定义二 概率的性质:0P(A)1 P(V)=0 P(U)=1三 独立事件和互不相容事件。四 概率的加法和乘法1 概率的加法 2 概率的乘法,正态分布是一种连续型随机变量的概率分布,在教育研究中有很多现象一般呈正态分布,1、正态分布,5.2 正态分布 5.2.1 概念:,正态分布中的、N都是常量,在每个正态分布中,它们的变化会导致正态曲线不同,如下图,尽管平均数相同,但由于不同而正态分布的形态差异较大。,标准分数(也称为Z分数)是一种以平均数为参照点,以标准差为
2、单位的相对量数,用Z表示。其特点为:把所有绝对数量表示的、的正态分布的曲线函数都变成了以平均数为0,标准差为1的正态分布曲线函数。,标准分数的计算公式,Z=,标准正态分布曲线(STANDARD NORMAL CURVE)分布的函数为:,2、标准正态分布 Z分数,标准正态分布曲线,=0、=1,?为什么标准正态分布的平均数为0,标准差为1!,3.标准正态分布的特点:,(1)已知Z值求面积 例1,例4,(2)已知面积求Z值 例1,某次测验分数是正态分布,其平均分是72,标准差是6,问在平均分上下多少分中间包括95%的学生?在平均分上下多少分中间包括99%的学生?,5.2.2 正态分布的应用,例1在某
3、一幼儿园的一次点数比赛中,全园的平均分是70,标准分是12.5,甲幼儿得78分,乙幼儿得83分,丙幼儿得65分,问这三幼儿的点数成绩在园中各处于怎样的位置,1.标准分的应用,解:=70 S=12.5 甲幼儿:Z=Z=0.64 乙幼儿:Z=Z=1.04 丙幼儿:Z=Z=0.4,答:甲幼儿的成绩在全园平均成绩以上0.64标准差;、乙幼儿的成绩在全园平均成绩以上1.04标准差;丙幼儿的成绩在全园平均成绩以下0.4个标准差。,表24:甲乙两幼儿语言、常识、计算成绩测试成绩表,例2甲乙两幼儿在语言、常识、计算活动中测试的成绩如下表,试分析说明谁的总成绩较好?,使用标准分数(Z)应注意的问题:,标准分数虽
4、然能够反映原始分数在团体中的相对位置,但不能直接体现对象对知识的掌握程度。所以在对对象学习情况进行评定和分析时,应将原始分数和标准分数结合起来分析研究。,2.标准正态分布的应用,等级考试A,B,C,D化学试卷满分值150分,某区全体学生平均分85分,标准差15。若A等占5%,B等占35%,C等占50%,D等占10%;则等第对应的分数线分别是多少?某校200人参加考试,获A等有多少人?,结论,由对应面积P查表得:Z1=1.65 X1=110Z2=0.25 X2=89Z3=-1.28 X3=65.8,第六章 抽样分布及总体平均数的推断,6.1 抽样分布6.2 总体平均数的估计 6.3 假设检验的基
5、本原理 6.4 总体平均数的显著性检验,上海市初中一年级末数学水平的调查研究,在该研究中假定上海市共有初中一年级学生为150000人(N 人),如果对上海所有初中一年级学生进行统一的标准化的数学成就测验,其测验的平均成绩为80分(),测验的标准差为9分()。,实例1,6.1 抽样分布6.1.1 研究实例,实例2,某一调查研究者甲为了节省调查研究的成本,现从上海市初中一年级学生中随机抽取500人(n人)进行统一的标准化的数学成就测验,试图通过这500人的测验结果来推断全上海初中一年级学生的数学水平,其测验的平均成绩为82分(),测验的标准差为8分(x)。,1、分析上述实例区分总体和样本区分参数与
6、统计量及不同的表达方式,如果我们用上海初一年级150000个学生的成绩做图,则构成一个总体分布图:,概率密度或百分比,成绩,如果我们只用其中抽取的500个个学生的成绩做图,则构成一个样本分布图:,概率密度或百分比,成绩,2、抽样分析假定该研究者第一次抽取500人做完调查研究后,又重新从上海初中一年级学生中(150000人)抽取500人(n2)进行调查研究,其平均数为:标准差为:x2(抽取学生的过程中,前面抽到的学生在后面抽取中也可能抽到,但不重复测验)。如果上述过程不断重复操作,则可以得到更多的样本平均数和标准差,如下表:,如果我们用k(k趋近于无穷大)个样本平均数做频数分布图,则构成一个由样
7、本平均数组成的抽样分布(平均数抽样分布)图:,概率密度或百分比,抽样的平均成绩,由这些抽样平均数组成分布的标准差称为平均数的标准误用 来表示。,标准误:某种统计量的标准差称为该统计量的标准误。,抽样分布是某一种统计量的概率分布,3、正态总体中,平均数的抽样分布呈正态,1、,2、,4、偏态总体中,当抽样容量较大时,平均数的抽样分布也呈正态,6.1.2 平均数抽样分布的几个定理,离差统计量是以标准差为单位来来度量某一个个案值与平均数间的差异。Z分数就是一种离差统计量,6.1.3 样本平均数与总体平均数离差统计量的形态,当总体标准差已知时,平均数的离差统计量的计算:,当总体标准差未知时,平均数的离差
8、统计量的计算:,首先根据样本标准差(x)来估计总体标准差(),其估计值用S来表示。,因此,平均数的标准误为:,离差统计量的表达形式为:,例:某校二年级学生的英语平均成绩为78,从中随机抽取50人,其平均成绩为82,标准差为12()。试估计该校二年级学生英语成绩的标准差,并计算50人平均成绩的离差统计量。,戈赛特(英国数学家1876-1937),戈塞特早先在牛津温切斯特及新(New)学院学习数学和化学,后来到都伯林市一家酿酒公司担任酿造化学技师,从事统计和实验工作,19061907年间,在伦敦大学学院生物实验室做研究,也有机会和皮尔逊共同研讨,此后他们经常通信.,1905年,戈塞特利用酒厂里大量
9、的小样本数据写了第一篇论文误差法则在酿酒过程中的应用 1908年,戈塞特以“学生(Student)”为笔名在生物计量学杂志发表了论文平均数的规律误差.,t分布及其特点,自由度:df表示,表6.1 中央面积为0.95时不同自由度t的临界值,1、点估计的定义:用某一样本统计量的值来估计相应总体参数的值。2、点估计的评价标准 无偏性 估计 有效性:Md Mo 一致性:n样本容量无限增大时,6.2 总体平均数的估计6.2.1 点估计,1、区间估计的定义:以概率分布为理论依据,按照一定的概率要求,由样本统计量的值估计总体参数值所在范围。2、区间估计的计算(总体标准差 知),例1:某一个正态总体,其平均数
10、为130,标准差为10。(1)以平均数为中心,95%学生的成绩的分布范围;(2)其成绩在128到132间的人数的比例;(3)上端5%学生成绩的分布范围。,6.2.2 区间估计,某一个正态总体,其平均数为130,标准差为10。(1)从总体中抽取25人,计算其平均成绩,该平均成绩在128到132间的概率有多大;(2)从总体中抽取25人,计算其平均成绩,该平均成绩以总体平均数为中心,95%概率下的分布范围。若总体平均数未知,从总体中抽取25人,计算其平均成绩为129,按一定概率要求估计总体参数的变化范围。区间估计,例2:,例3某小学10岁儿童身高的标准差为6.25厘米,现从该校随机抽出27名10岁儿
11、童,其平均身高为134.2厘米,试估计该校10岁儿童身高的95%和99%置信区间.,在总体标准差未知,总体呈正态分布,n无论大小,(或总体不呈正态分布,n30)样本平均数与总体平均数的离差统计量呈t分布;,t值,3、总体标准差()未知条件下的区间估计,区间估计原理,例1从某小学三年级学生中随机抽取12名学生,其其阅读能力平均分数为29.917,s=4.100.试估计该校三年级学生总体平均成绩95%和99%的置信区间。,例2从某年高考随机抽取102份作文试卷,其平均成绩为26,标准差为1.5。试估计总体平均成绩95%和99%的置信区间。,1、假设检验的定义2、假设检验的原理,6.3 假设检验的基
12、本原理和过程 6.3.1 假设检验的原理,基本思想,小概率原理:,如果对总体的某种假设是真实的,那么不利于或不能支持这一假设的事件A(小概率事件)在一次试验中几乎不可能发生的;要是在一次试验中A竟然发生了,就有理由怀疑该假设的真实性,拒绝这一假设。,总 体(某种假设),抽样,样 本(观察结果),检验,(接受),(拒绝),小概率事件未 发 生,小概率事件发 生,假设的形式:,H0原假设,H1备择假设,双侧检验:H0:=0,H1:0,单侧检验:H0:0,H1:0 H0:0,H1:0,假设检验就是根据样本观察结果对原假设(H0)进行检验,接受H0,就否定H1;拒绝H0,就接受H1。,1、两类错误的定
13、义错误:假设是真而被拒绝,其大小与假设检验的显著性水平相等。错误:假设是伪而被接受。,6.3.2 统计决断的两类错误及其控制,2、两类错误的相互关系在我们做决策时两类错误客观存在;当一种错误在减小时,另一类错误在增加。,3、控制两类错误的方法,合理安排拒绝区域的位置;,扩大抽样的容量。,4、抽样容量要多大?,样本容量的扩大引起的变化是什么?,1.根据具体问题的要求,建立总体假设H0,H1,2.选择统计量确定H0为真时的抽样分布,3.给定显著性水平,当原假设H0为真时,求出临界值。,4.计算检验统计量的数值与临界值比较,6.3.3 假设检验中的基本过程,6.4.1 总体标准差()已知条件下的总体
14、平均数的显著性检验,例1全区统一考试物理平均分为50分,标准差为10分。某校一个班41人的平均成绩为52.5,问该班成绩与全区成绩差异是否显著?,6.4 总体平均数的显著性检验,1.假设:H0:=50,H1:50,2.选择检验统计量并计算其值,3.确定显著性水平,查表求出临界值。=0.05,Z0.05=1.96,4.统计决断:z=1.601.960.05,小概率事件没有发生,接受H0:=50即该班成绩与全区成绩无显著性差异。,例2,张老师是一名刚参加工作的青年化学老师,在某中学负责讲授高中一年级(4)班化学课程,期末全校化学统一考试,高一5个班的化学平均分是68分,标准差为8.6分,其中4班有
15、46名同学,化学平均分为63分。根据考试结果,学校领导认为张老师的教学效果低于全校的平均水平。问题:张老师所带的高一(4)班化学平均分低于全年级的平均水平吗?,1.假设:H0:68,H1:68,2.选择检验统计量并计算其值,3.确定显著性水平,查表求出临界值。=0.05,Z0.05=-1.65;=0.01,Z0.01=-2.33;,4.统计决断:z=3.942.330.01,小概率事件发生了,拒绝H0:68,接受 H1:68即该班化学成绩低于全年级的平均水平。,练习:有人从受过良好教育早期儿童中随机抽取70人施行韦氏智力测验(该测验的总体平均数为100,标准差为15),其结果为103.3。能否
16、认为受过良好早期教育的儿童智力高于一般水平?,例题1:某区初三英语统一测验平均分为65分,该区某校20份试卷的分数为:72、76、68、78、62、59、64、85、70、75、61、74、87、83、54、76、56、66、68、62。问该校初三英语平均分与全区是否一样?,6.4.2 总体标准差()未知条件下的总体平均数的显著性检验,=69.8,s=9.474,1.假设:H0:=65,H1:65,2.选择检验统计量并计算其值,3.确定显著性水平,查表求出临界值。=0.05,t(19)0.05=2.093;=0.01,t(19)0.01=2.861;,4.统计决断:t(19)0.05=2.09
17、3 t=2.266 t(19)0.01=2.861在=0.05拒绝H0:=65,接受H1:65即该校初三英语平均分与全区不一样,例题2:,王老师在某大学担任5个班的英语课,为了研究英语演讲比赛对学生英语学习成绩的影响,选定(1)班学生进行实验。每次她给(1)班上课占用10分钟时间让学生进行演讲比赛。一学期后,全校期末英语考试平均分为78分,(1)班15名同学考试成绩:,问题:学生演讲比赛是否能提高英语学习成绩?,平均分:82.3,标准差(S):7.32,1.假设:H0:78,H1:78,2.选择检验统计量并计算其值,3.确定显著性水平,查表求出临界值。=0.05,t(14)0.05=1.761
18、;=0.01,t(14)0.01=2.624;,4.统计决断:t(14)0.05=1.761 t=2.275 t(14)0.01=2.624在=0.05拒绝H0:78,接受H1:78即学生演讲比赛能提高英语学习成绩.,总体标准差()未知,n较大情况,某年高考某市数学平均分为60,现从参加此次考试的文科生中,随机抽取94份试卷,算的平均分为58分,标准差为9.2,问文科生的数学成绩与全市考生是否相同?,1.假设:H0:=60,H1:60,2.选择检验统计量并计算其值,3.确定显著性水平,查表求出临界值。=0.05,z0.05=1.96;=0.01,z0.01=2.58;,4.统计决断:z0.05
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 教育 统计学 课件 推断 统计

链接地址:https://www.31ppt.com/p-6293961.html