沈阳理工大学徐静霞版统计学(12)第5章参数估计ppt课件.ppt
《沈阳理工大学徐静霞版统计学(12)第5章参数估计ppt课件.ppt》由会员分享,可在线阅读,更多相关《沈阳理工大学徐静霞版统计学(12)第5章参数估计ppt课件.ppt(84页珍藏版)》请在三一办公上搜索。
1、Fundamental Statistics,统计学基础,第5章 参数估计,5.1 抽样与抽样分布5.2 参数估计的基本原理5.3 总体均值的区间估计5.4 总体比例的区间估计5.5 样本量的确定,导入案例:,大学生每天花多少时间上网 某大学经济管理学院为了解学生每天上网的时间,在全院1500名学生中采取不重复抽样方法随机抽取36人,调查他们每天上网的时间,得到下面的数据(单位:小时): 根据上表的计算,样本的平均上网时间为3.317小时,标准差为1.609小时。根据这些资料,该如何推断全院学生每天的平均上网时间呢?每天上网时间超过4小时的学生比例又应该是多少?本章将对这些问题进行阐述。,学习
2、目标,1.抽样与抽样分布。了解概率抽样的方法,熟悉常见的随机变量概率分布,掌握样本均值和样本比例的抽样分布。2.参数估计的基本原理。熟悉参数估计的数理统计基础,重点掌握点估计和区间估计的原理。,学习目标,3.总体均值的区间估计。重点掌握在大样本条件下总体均值的区间估计,以及正态总体方差未知和小样本下总体均值的区间估计。4.总体比例的估计。重点掌握大样本下总体比例的区间估计。5.样本量的确定。重点掌握估计总体均值和估计总体比例时样本量的确定方法。,5.1 抽样与抽样分布,5.1.1 概率抽样的方法5.1.2 几种重要的随机变量分布5.1.3 抽样分布5.1.4 统计量的标准误,5.1.1 概率抽
3、样的方法,概率抽样:是根据一个已知的概率来抽取样本单位,总体中哪一个单位会被抽中,并不取决于研究人员的主观意愿,而是取决于客观的机会概率。特点:单位被抽中完全是随机的。一般的抽样推断都是建立在概率抽样的基础之上的。常见的概率抽样方法有:简单随机抽样,分层抽样,系统抽样,整群抽样等。,5.1.1.1简单随机抽样,简单随机抽样:又称纯随机抽样,它是按随机原则直接从总体N中抽取样本单位n。特点:每个样本单位被抽中的概率相等,样本的每个单位完全独立,彼此间无一定的关联性和排斥性。适用的条件:通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法。简单随机抽样方法简便,易于掌握。分类:重复抽样和
4、不重复抽样。,重复抽样,重复抽样也叫重置抽样,是指每次抽取一个单位记录其标志表现后又放回,重新参加下一次的抽选。重复抽样可能的样本数为:,不重复抽样,不重复抽样也叫不重置抽样,是指每次从总体中抽取一个单位记录其标志表现后不再放回,从剩余的单位中抽取下一个单位。不重复抽样可能的样本数为:,5.1.1.2分层抽样,分层抽样:是常用的一种抽样方式,它是先将总体各单位划分成若干类(或层),然后在各组内按随机原则抽取若干单位,将所有组抽样的样本单位组成一个样本。 特点:1.将总体内性质比较接近的单位分在一组,然后在每一组内抽样;2.除了可以对总体进行估计外,还可以对各层的子总体进行估计;3.分层抽样可以
5、按自然区域或行政区域进行分层,使抽样组织和实施都比较方便。适用范围:总体情况复杂,各单位之间差异较大,单位较多的情况。,5.1.1.3系统抽样,系统抽样:是将总体各单位按某种顺序排列成为图形或一览表式(也就是通常所说的排队),然后按相等的距离或间隔抽取样本单位。 特点是:1、抽取方式简单,容易实施 2、样本在总体中分布较为均匀例如:对某市的工业企业做调查,就可以按照相关部门的习惯顺序排列,直接利用这些顺序进行等距抽样。,5.1.1.4整群抽样,整群抽样:它是将研究对象的总体划分为若干群(或称为组),然后按照随机的原则抽取若干个群(或组),对抽中的群(或组)内所有单位都进行调查的一种抽样组织形式
6、。 特点是:研究的单位比较集中,工作的组织和进行比较方便,可以节省人力、物力和财力,尤其是当总体中包括的单位数很多,且缺乏可靠的登记资料时经常采用。适用范围:群间差异性不大或者不适宜单个地抽选样本的情况。,在重复选取容量为n的样本时,由每一个样本算出的该统计量数值的相对频数分布或概率分布 是一种理论分布。随机变量是 样本统计量样本均值, 样本比例,样本方差等结果来自容量相同的所有可能样本提供了样本统计量长远稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据,抽样分布 (sampling distribution),5.1.2几种重要的随机变量分布,二项分布、正态分布、 分布、t分布
7、、F分布,5.1.2.1二项分布,二项分布是离散型随机变量概率分布的一种,是建立在贝努力实验的基础上的。n重贝努力实验满足下列条件:1.一次实验只有两个可能,即“成功”和“失败”。2.一次实验“成功”的概率为 ,“失败”的概率为 而且概率对每次试验都是相同的。3.实验是相互独立的,且可以重复进行n次。在n次实验中,“成功”的次数的概率分布就是二项分布记为 。n次实验中成功次数为x的概率可表示为:二项分布的期望值和方差分别为:,某电子元件厂,已知其一批产品的合格率为95%,从中有放回的抽取10个,求10个产品中:(1)全部合格的概率;(2)有一个不合格产品的概率;(3)有2个以下不合格产品的概率
8、。,【例5.1】,【例5.1】,解:每取一个产品就是一次独立实验,n=10,由于是有放回的抽取,因此每次试验是独立的,每次抽取不合格率为5%。设X为抽取的不合格产品数,显然,概率分布分别为(1),(2),(3),5.1.2.2正态分布,特点:在总体平均数及其附近,总体单位数最多;相 反地,越远离总体平均数,总体单位数越少。若随机变量服从正态分布,记为 ,其概率密度函数所对应的曲线如图所示。,不同的 值和 值,对应的正态分布就不同。,图2 不同的 的正态分布曲线图,不同的 值和 值,对应的正态分布就不同。,图3 不同的 正态分布曲线图,我们把参数 时的正态分布称为标准正态分布(standard
9、normal ditribution),如果随机变量X服从 正态分布,其数学期望值(均值)为 方差为 ,若令 则Z就服从标准正态分布,通常用记为ZN(0,1)表示。,(1),(2),(3),某厂生产一批小型装置,其寿命X服从均值为8,标准差为2(单位:年)的正态分布。(1)求整批小型装置中寿命大于7的比率;(2)求整批小型装置中寿命介于7-9年的比率;(3)如果工厂规定在保用期间遇有故障可免费换新,将要求免费换新的比率定为3%,求保用年限。,【例5.2】,解:,(1)利用【NORMDIST】函数:,(2)利用【NORMDIST】函数:,(3)利用【NORMINV】函数得: MORMINV(0.
10、03)=4.2384128 即工厂应将保用年限定为4年。,5.1.2.3 分布(适用于方差的估计与检验),分布具有如下的特征:,1. 分布的变量值始终为正值;,2. 分布的形状取决于自由度n的大小,通常为不对称的右偏分布,但随着自由度的增大逐渐趋于对称,如图4所示.,5.1.2.4 t 分布,t分布是类似正态分布的一种对称分布,当随机变量X服从标准正态分布N(0,1),Y服从分布 ,X,Y相互独立,则,分布称为t分布,记为t(n),其中n为自由度。,t分布通常比标准正态分布要分散和平坦一些,如下图5所示。,5.1.2.5 F 分布,F分布(F-distribution)是两个 分布的比。设随机
11、变量Y和Z相互独立,且Y和Z分别服从自由度为m和n的 分布,则随机变量X,,服从第一自由度为m,第二自由度为n的F分布,记为F(m,n)。F分布的图形与 分布类似,其形状取决于两个自由度,如图6所示。,在重复选取容量为n的样本时,由每一个样本算出的该统计量数值的相对频数分布或概率分布 是一种理论分布。随机变量是 样本统计量样本均值, 样本比例,样本方差等结果来自容量相同的所有可能样本提供了样本统计量长远稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据,抽样分布 (sampling distribution),【例5.3】已知总体有4名学生A,B,C,D,他们的年龄分别为 岁, 岁
12、, 岁, 岁,从中抽取2人调查平均年龄。此时,样本均值的抽样分布是所有的样本均值形成的相对频数分布,即 的概率分布。,5.1.3.1样本均值的抽样分布,总体平均年龄,总体标准差,表2 重复抽样且考虑抽样顺序样本及其均值 计算表,表3 样本平均数 分布,样本均值的分布与总体分布的比较 (例题分析), = 23 2 =5,总体分布,样本均值分布,样本均值的抽样分布与中心极限定理,当总体服从正态分布N(,2)时,来自该总体的所有容量为n的样本的均值X也服从正态分布,X 的数学期望为,方差为2/n。即XN(,2/n),中心极限定理(central limit theorem),中心极限定理:设从均值为
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 沈阳 理工大学 徐静霞版 统计学 12 参数估计 ppt 课件

链接地址:https://www.31ppt.com/p-1347015.html