抽样与参数估计.PPT
《抽样与参数估计.PPT》由会员分享,可在线阅读,更多相关《抽样与参数估计.PPT(88页珍藏版)》请在三一办公上搜索。
1、第六章 抽样与参数估计,参数估计在统计方法中的地位,统计方法,描述统计,推断统计,假设检验,统计推断的过程,第六章 抽样与参数估计,第一节 抽样与抽样分布 第二节 参数估计基本方法第三节 总体均值和总体比例的区间估计第四节 两个总体均值及两个总体比例之差的估计第五节 正态总体方差及两正态总体方差比的区间估计,学习目标,了解抽样和抽样分布的基本概念理解抽样分布与总体分布的关系了解点估计的概念和估计量的优良标准掌握总体均值、总体比例和总体方差的区间估计,第一节 抽样与抽样分布,一.总体、个体和样本二.关于抽样方法样本均值的分布与中心极限定理样本方差的分布两个样本方差比的分布六.T 统计量的分布,总
2、体、个体和样本(概念要点),总体(Population):调查研究的事物或现象的全体个体(Item unit):组成总体的每个元素样本(Sample):从总体中所抽取的部分个体样本容量(Sample size):样本中所含个体的数量,抽样方法(概念要点),概率抽样:根据已知的概率选取样本 简单随机抽样:完全随机地抽选样本 分层抽样:总体分成不同的“层”,然后在每一层内进行抽样 整群抽样:将一组被调查者(群)作为一个抽样单位 等距抽样:在样本框中每隔一定距离抽选一个被调查者非概率抽样:不是完全按随机原则选取样本 非随机抽样:由调查人员自由选取被调查者 判断抽样:通过某些条件过滤来选择被调查者配额
3、抽样:选择一群特定数目、满足特定条件的被调查者,样本均值的抽样分布,所有样本指标(如均值、比例、方差等)所形成的分布称为抽样分布是一种理论概率分布随机变量是 样本统计量样本均值,样本比例等结果来自容量相同的所有可能样本,抽样分布(概念要点),样本均值的抽样分布(一个例子),【例】设一个总体,含有4个元素(个体),即总体单位数N=4。4 个个体分别为X1=1、X2=2、X3=3、X4=4。总体的均值、方差及分布如下,均值和方差,样本均值的抽样分布(一个例子),现从总体中抽取n2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果如下表,样本均值的抽样分布(一个例子),计算出各样
4、本的均值,如下表。并给出样本均值的抽样分布,所有样本均值的均值和方差,式中:M为样本数目比较及结论:1.样本均值的均值(数学期望)等于总体均值 2.样本均值的方差等于总体方差的1/n,样本均值的分布与总体分布的比较,抽样分布,=2.5 2=1.25,总体分布,样本均值的抽样分布与中心极限定理,当总体服从正态分布N(,2)时,来自该总体的所有容量为n的样本的均值X也服从正态分布,X 的数学期望为,方差为2/n。即XN(,2/n),中心极限定理(图示),中心极限定理:设从均值为,方差为 2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为、方差为2/n的正态分布,样
5、本方差的抽样分布,样本方差的分布,设总体服从正态分布N(,2),X1,X2,Xn为来自该正态总体的样本,则样本方差 s2 的分布为,将2(n 1)称为自由度为(n-1)的卡方分布,卡方(c2)分布,均值的标准误,所有可能的样本均值的标准差,测度所有样本均值的离散程度小于总体标准差计算公式为,两个样本方差比的抽样分布,两个样本方差比的抽样分布,设X1,X2,Xn1是来自正态总体N(1,12)的一个样本,Y1,Y2,Yn2是来自正态总体N(2,22)的一个样本,且Xi(i=1,2,,n1),Yi(i=1,2,,n2)相互独立,则,将F(n1-1,n2-1)称为第一自由度为(n1-1),第二自由度为
6、(n2-1)的F分布,两个样本方差比的抽样分布,不同样本容量的抽样分布,T 统计量的分布,T 统计量的分布,设X1,X2,Xn1是来自正态总体N(1,12)的一个样本,称,为统计量,它服从自由度为(n-1)的t 分布,第二节 参数估计基本方法,一.点估计二.点估计的优良性准则区间估计,参数估计的方法,被估计的总体参数,点 估 计,点估计(概念要点),从总体中抽取一个样本,根据该样本的统计量对总体的未知参数作出一个数值点的估计例如:用样本均值作为总体未知均值的估计值就是一个点估计2.点估计没有给出估计值接近总体未知参数程度的信息点估计的方法有矩估计法、顺序统计量法、最大似然法、最小二乘法等,1.
7、用于估计总体某一参数的随机变量如样本均值,样本比例、样本中位数等例如:样本均值就是总体均值的一个估计量如果样本均值 x=3,则 3 就是 的估计值理论基础是抽样分布,估计量(概念要点),二战中的点估计,估计量的优良性准则(无偏性),无偏性:估计量的数学期望等于被估计的总体 参数,估计量的优良性准则(有效性),有效性:一个方差较小的无偏估计量称为一个更 有效的估计量。如,与其他估计量相比,样本均值是一个更有效的估计量,估计量的优良性准则(一致性),一致性:随着样本容量的增大,估计量越来越接 近被估计的总体参数,区间估计,区间估计(概念要点),1.根据一个样本的观察值给出总体参数的估计范围给出总体
8、参数落在这一区间的概率例如:总体均值落在5070之间,置信度为 95%,置信区间估计(内容),落在总体均值某一区间内的样本,总体未知参数落在区间内的概率表示为(1-为显著性水平,是总体参数未在区间内的概率常用的显著性水平值有 99%,95%,90%相应的 为0.01,0.05,0.10,置信水平,区间与置信水平,均值的抽样分布,(1-)%区间包含了%的区间未包含,影响区间宽度的因素,1.数据的离散程度,用 来测度样本容量,3.置信水平(1-),影响 Z 的大小,第三节 总体均值和总体比例 的区间估计,一.总体均值的区间估计二.总体比例的区间估计样本容量的确定,总体均值的区间估计(已知),总体均
9、值的置信区间(已知),1.假定条件总体服从正态分布,且总体方差()已知如果不是正态分布,可以由正态分布来近似(n 30)使用正态分布统计量,总体均值 在1-置信水平下的置信区间为,总体均值的区间估计(正态总体:实例),解:已知N(,0.152),x2.14,n=9,1-=0.95,/2=1.96 总体均值的置信区间为,我们可以95的概率保证该种零件的平均长度在21.30221.498 mm之间,【例】某种零件长度服从正态分布,从该批产品中随机抽取件,测得其平均长度为21.4 mm。已知总体标准差=0.15mm,试建立该种零件平均长度的置信区间,给定置信水平为0.95。,总体均值的区间估计(非正
10、态总体:实例),解:已知 x26,=6,n=100,1-=0.95,/2=1.96,我们可以95的概率保证平均每天参加锻炼的时间在24.82427.176 分钟之间,【例】某大学从该校学生中随机抽取100人,调查到他们平均每天参加体育锻炼的时间为26分钟。试以95的置信水平估计该大学全体学生平均每天参加体育锻炼的时间(已知总体方差为36小时)。,总体均值的区间估计(未知),总体均值的置信区间(未知),1.假定条件总体方差()未知总体必须服从正态分布使用 t 分布统计量,3.总体均值 在1-置信水平下的置信区间为,总体均值的区间估计(实例),解:已知N(,2),x=50,s=8,n=25,1-=
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样 参数估计
链接地址:https://www.31ppt.com/p-6118620.html