教育统计学第六章.ppt
《教育统计学第六章.ppt》由会员分享,可在线阅读,更多相关《教育统计学第六章.ppt(48页珍藏版)》请在三一办公上搜索。
1、,第六章 抽样分布及总体 平均数的推断第一节 抽样分布第二节 总体平均数的推断第三节 假设检验的基本原理第四节 总体平均数的显著性检验,一、抽样分布的概念区分三种不同性质的分布总体分布:总体内个体数值的频数分布样本分布:样本内个体数值的频数分布抽样分布:某一统计量的频数分布,第一节 抽样分布,二、平均数抽样分布的几个定理(1)从总体中随机抽取容量为n的一切可能样本的平均数之平均数等于总体的平均数,即,(2)容量为n的平均数在抽样分布上的标准差,等于总体标准差除以n的平方根,即,(3)从服从正态分布的总体中,随机抽取容量为n的一切可能样本平均数的分布也呈正态分布。,(4)虽然总体不呈正态分布,如
2、果样本容量较大,反映总体 和 的样本平均数的抽样分布,也接近于正态分布。,以上几条定理反应了平均数抽样分布的形态,一切可能样本平均数与总体平均数之间的关系;平均数抽样分布的标准差与总体标准差之间的关系。抽样分布是统计推断的理论依据。实际中只能抽取一个随机样本根据一定的概率来推断总体的参数。即使是抽取一切可能样本,计算出的某种统计量与总体相应参数的真值,大多也是不相同的,这是由于抽样误差的缘故。抽样误差用抽样分布的标准差来表示。因此,某种统计量在抽样分布上的标准差称为该种统计量的标准误。标准误越小,表明样本统计量与总体参数的值越接近,样本对总体越有代表性,用样本统计量推断总体参数的可靠度越大,所
3、以标准误是统计推断可靠性的指标。,三、样本平均数与总体平均数离差统计量的形态,从正态总体中随机抽取样本容量为n的一切可能样本平均数以总体平均数为中心呈正态分布。当总体标准差已知时:,当总体标准差未知时:,总体标准差 的无偏估计量为,参数估计 假设检验 一、总体参数估计的基本原理 根据样本统计量对相应总体参数所作的估计叫总体参数估计。总体参数估计分为点估计和区间估计。1.点估计 点估计是指用样本统计量的值来估计相应总体参数的值。点估计的优点在于它能够提供总体参数的估计值;缺点在于它总是以误差的存在为前提,但又不能提供正确估计的概率。,第二节 总体平均数的估计,良好估计量的标准(1)无偏性:用统计
4、量估计总体参数一定会有误差,不可能恰恰相同。因此,好的估计量应该是一个无偏估计量,即用多个样本的统计量作为总体参数的估计值,其偏差的的平均值为0。(2)有效性:当总体参数的无偏估计不止一个统计量,无偏估计变异性小者有效性高,变异大者有效性低。(3)一致性:当样本容量无限增大时,估计量的值能越来越接近它所估计的总体参数值,估计值越来越精确,逐渐趋近于真值。(4)充分性:一个容量为的样本统计量,是否充分地反映了全部个数据所反映总体的信息。,2.区间估计 区间估计的概念 区间估计是指以样本统计量的样本分布为理论依据,按一定的概率要求,由样本统计量的值估计总体参数值的所在范围。置信区间与显著性水平 置
5、信区间是指在某一置信度时,总体参数所在的区域距离或区域长度。显著性水平是指估计总体参数落在某一区间时,可能犯错误的概率,用表示。1为置信度或置信水平。,区间估计的原理 区间估计的原理是样本分布理论。在计算区间估计值、解释估计的正确概率时,依据是该样本统计量的分布规律及样本分布的标准误。下面以平均数的区间估计为例,说明如何根据平均数的样本分布及平均数分布的标准误,计算置信区间和解释成功估计的概率。当总体标准差为已知时,样本平均数的分布为正态分布或渐近正态分布,此时样本平均数分布的平均数,标准误。根据正态分布,可以说:有95%的 落在 之间,或者说:之间包含所有的 的95%,即,但是,在实际研究中
6、,只能得到一个样本平均数,我们可以将这个样本平均数看做是无限多个样本平均数之中的一个。于是将上式经过移项写成 这意味着有 95%的 落在 之间,或者说,估计 落在 之间正确的概率为 95%。,估计总体平均数的步骤(1)根据实得样本的数据,计算样本平均数与标准差。(2)计算标准误。(已知)或(未知)(3)确定置信区间或显著性水平。(4)根据样本平均数的抽样分布,确定查何种统计表。(5)计算置信区间。(正态分布)或(分布)(6)解释总体平均数的置信区间。,总体方差2 已知时,对总体平均数的估计,(1)当总体分布为正态时 当总体分布为正态,总体方差 已知时,样本平均数 的分布为正态分布,这时可用下式
7、计算其置信区间:(其中)(2)当总体分布为非正态时 总体分布非正态,总体方差 已知,这时只有当样本容量 时,其样本平均数 的分布为渐近正态分布,这时可用下式计算其置信区间:(其中),例如:某小学10岁全体女童身高历年来标准差6.25cm,现从该校随机抽27名10岁女童,测得平均身高为134.2cm,试估计该校全体10岁女童平均身高95%和99%置信区间。,总体方差2 未知时,对总体平均数的估计,(1)当总体分布为正态时 当总体分布为正态,总体方差 未知时,样本平均数 的分布为分布,这时可用下式计算其置信区间:(其中)(2)当总体分布为非正态时 总体分布非正态,总体方差 未知,这时只有当样本容量
8、 时,其样本平均数 的分布为渐近分布,这时可用下式计算其置信区间:(其中),小样本的情况,例如,从某小学二年级随机抽取12名学生,其阅读能力得分为28、32、36、22、34、30、33、25、31、33、29、26.试估计该校二年级阅读能力总体平均数95%和99%的置信区间。,大样本的情况,例如,从某年高考中随机抽取102份作文试卷,平均分数为26,标准差为1.5,估计总体平均数95%和99%的置信区间。说明:样本容量n=10330,t分布接近正态分布,故可用正态分布近似处理。,第三节 假设检验的基本原理,一、假设 假设是根据已知理论与事实对研究对象所做的假定性说明,统计学中的假设一般专指用
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 教育 统计学 第六
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-6576674.html