抽样误差均数估计于.ppt
《抽样误差均数估计于.ppt》由会员分享,可在线阅读,更多相关《抽样误差均数估计于.ppt(90页珍藏版)》请在三一办公上搜索。
1、第四章 统计推断基础抽样误差、参数估计Sampling error and Parameter estimation,主要内容,抽样误差中心极限定理标准误抽样分布(分布2 分布F分布)参数估计,1.抽样误差 Sampling error,抽样误差中心极限定理标准误抽样分布参数估计,了解抽样误差的重要性,总体同质、个体变异,总体参数未知,样本代表性、抽样误差,随机抽样,样本统计量已知,统计推断,风 险,抽样误差,sampling error,sampling variability 由抽样引起的样本统计量与总体参数间的差别。原因:个体变异抽样 表现:样本统计量与总体参数间的差别不同样本统计量间的
2、差别 抽样误差是不可避免的!抽样误差是有规律的!,假设一个已知总体,从该总体中抽样,对每个样本计算样本统计量(均数、方差等),观察样本统计量的分布规律抽样分布规律。正态分布总体偏三角分布总体均匀分布总体指数分布总体双峰分布总体,均数的模拟试验,均数的模拟试验,考察:样本均数的均数与总体均数有何关系?样本均数的标准差与总体标准差有何关系?样本均数的分布形状如何?不同的样本含量对上述性质的影响如何?,抽样分布规律,样本含量n=10抽样次数m=100,红细胞计数,图 正态分布N(5.00,0.502)总体分布,表4、1 N(5.00,0.502)总体中11个随机样本的数据(n=10),结论 1,各样
3、本均数未必等于总体均数;样本均数间存在差异;,由抽样实验所得的100个样本作出其均数 分布直方图如图4.1。曲线是对抽样得到的100个 数据拟合的分布曲线。,图 从正态分布N(5.00,0.502)总体中抽样样本均数的分布,图 从正态分布N(5.00,0.502)总体中抽样样本均数的分布,结论2,的分布很有规律,围绕着,中间多,两边少,左右基本对称;样本均数的变异范围较之原变量的变异范围大大缩小;,2.中心极限定理 central limit theorem,抽样误差中心极限定理标准误抽样分布参数估计,中心极限定理(central limit theorem)(一)从均数为、标准差为 的正态总
4、体中,独立随机抽取例数为n的样本,样本均数 的分布服从正态分布;样本均数的均数为;样本均数的标准差为。,中心极限定理,(二)从非正态(nonnormal)分布总体(均数为,方差为)中随机抽样(每个样本的含量为n),可得无限多个样本,每个样本计算样本均数,则只要样本含量足够大(n50),样本均数也近似服从正态分布。样本均数的均数为;样本均数的标准差为。,3.标准误 standard error,抽样误差中心极限定理标准误抽样分布参数估计,标准误(standard error),样本统计量的标准差称为标准误。样本均数的标准差称为均数的标准误。均数的标准误表示样本均数的变异度。当总体标准差未知时,用
5、样本标准差代替,前者称为理论标准误,后者称为样本标准误。,与样本含量的关系,n 越大,均数的均数就越接近总体均数;n 越大,变异越小,分布越窄;对称分布接近正态分布的速度,大于非对称分布。分布越偏,接近正态分布所需样本含量就越大。,与标准差的关系,1、意义上标准差描述个体值之间的变异,即观察值间的离散程度;而标准误是描述统计量的抽样误差,即样本统计量和总体参数的接近程度;2、用途上标准差常用于表现观察值的波动范围;标准误常表示抽样误差的大小,估计总体参数可信区间。3、与样本含量标准差是随着样本含量的增多,逐渐趋于稳定。标准误是随着样本含量的增多,逐渐减少。,区别,与标准差的关系,首先,标准差和
6、标准误都是变异指标,说明个体之间的变异用标准差,说明统计量之间的变异用标准误。其次,当样本含量不变时,标准差大,标准误亦越大,均数的标准误与标准差成正比。,联系,4.抽样分布(1)t-distribution,抽样误差中心极限定理标准误抽样分布参数估计,正态分布的标准化变化,若 X N(,),则。,因,则。,从正态分布总体中1000次抽样的 u 值的分布(n=4),Fraction,u,-4,-3,-2,-1,0,1,2,3,4,0,.05,.1,.15,.2,均数为 0.007559标准差为 1.006294,t 分布的概念,实际工作中,总体方差未知。所以,用样本方差代替总体方差,此时 的分
7、布如何?,从正态分布总体中1000次抽样的 值的分布(n=4),Fraction,t,-8,-6,-4,-2,0,2,4,6,8,0,.05,.1,.15,.2,.25,.3,.35,均数为 0.05696标准差为 1.55827,t 分布的概念,用样本方差代替总体方差,此时不服从正态分布。,1908年,(1876-1937)以笔名Student发表了著名的t分布,证明了:设从正态分布N(,2)中随机抽取含量为n的样本,样本均数和标准差分别为 和s,设:,则t值服从自由度为n-1的t分布(t-distribution)。,t 分布的概念,记为:,图 自由度分别为1、5、时的t分布,t分布图形,
8、t分布的特征,t分布是一簇曲线,当不同时,曲线形状不同;单峰分布,以0为中心,左右对称;当逼近时,t分布逼近u分布,故标准正态分布是t分布的特例;t分布曲线下面积是有规律的。,请看演示,t 分布,t界值表,表上阴影部分,表示t,以外的尾部面积占总面积百分数,即概率P。表中数据表示与确定时相应的t界值(critical value),常记为t,。,抽样,总体,样本,统计量,分布,t分布表明,从正态分布总体中随机抽取的样本,由样本计算的t值接近0的可能性较大,远离0的可能性较小。,例如,当=10,单尾概率=0.05时,查表得单尾t0.05,10=1.812,则:P(t-1.812)=0.05或P(
9、t1.812)=0.05,表明:按t分布的规律,从正态分布总体中抽取样本含量为n=11的样本,则由该样本计算的t值大于等于1.812的概率为0.05,或者小于等于-1.812的概率亦为0.05。,-1.812,0,0.05,0.05,1.812,例如,当=10,双尾概率=0.05时,查表得双尾t0.05,102.228,则:P(t-2.228)+P(t2.228)0.05或:P(-2.228t2.228)=1-0.05=0.95。,表明:按t分布的规律,从正态分布总体中抽取样本含量为n=11的样本,则由该样本计算的t值大于等于2.228的概率为0.025,小于等于-2.228的概率亦为0.02
10、5。,-2.228,0,0.025,0.025,2.228,单尾:P(t-t,)=,或P(tt,)=双尾:P(t-t/2,)+P(tt/2,)=,即P(-t/2,t t/2,)=1-,-t,0,t,t分布曲线下面积规律,4.抽样分布(2)chi-distribution,抽样误差中心极限定理标准误抽样分布参数估计,2 分布,设从正态分布N(,2)中随机抽取含量为n的样本,样本均数和标准差分别为 和s,设:2值服从自由度为n-1的2分布(2-distribution),2 分布,请看演示,c2 分布,2分布的特征,(1)2分布为一簇单峰正偏态分布曲线;随的逐渐加大,分布趋于对称。(2)自由度为的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样误差 估计

链接地址:https://www.31ppt.com/p-6164182.html