《抽样估计》课件.ppt
,第五章 抽样估计,第一节 抽样估计的意义和作用,(一)抽样估计的概念,一、抽样估计的意义,(二)抽样估计的特点,、抽样估计是用样本的指标数值去推算总体的指标数值。,二、抽样估计的作用,(二)对某些属于破坏性或消耗性产品质量的检查。,(五)抽样估计法可以用于生产过程的质量控制。,三、抽样估计法的理论基础,理论基础:大数法则,中心极限定理,第二节 概率与概率分布,一、概率的概念及其计算方法,P()=m/n,概率是一个界于与之间的分数。,二、概率分布的概念和种类,(一)概率分布的概念,任何概率分布都满足如下两个要求:,(二)概率分布的种类,按随机变量性质的不同:,1、数量型随机变量的概率分布,2、品质型随机变量的概率分布,三、两种常见的概率分布,(一)二项分布,在一次试验中,A事件出现概率为p,不出现的,概率为q,那么在连续n次试验中,事件共出现,k次的概率为:,根据二项分布概率,可求得其期望与方差。,二项分布具有以下特点:,(二)正态分布,二项分布-属于离散型随机变量的分布;,正态分布-属于连续型随机变量的分布。,正态分布的密度函数 为:,式中 为正态分布的平均数,是它的标差,,因此,正态分布可以简记为,1.正态分布具有如下性质:,()当 时,值最大;,(4)在 处,为 曲线的拐点;,()当 时,.,标准正态分布,2、正态分布的标准化,令新的随机变量为:,可得到标准正态分布的函数为:,正态分布函数为:,例如:=1()=68.27%=1.96()=90%=2()=95.45%=3()=99.73%=4()=99.99%,中心极限定理揭示了样本平均数概率分布的以下结论:,第三节 抽样估计的基本概念,一、全及总体和抽样总体,n/N称为抽样比例.,二、全及指标和抽样指标,(二)抽样指标抽样指标是指根据抽样总体各,单位标志值计算的综合指标,又称样本指标。,常用的抽样指标有:抽样平均数、抽样成数、,抽样总体标准差和抽样总体方差。,其计算公式为:,三、重复抽样和不重复抽样,第四节 抽样估计的一般原理,一、抽样估计的特点,(二)抽样估计运用的是概率原理。,二、抽样估计的优良标准,即:,三、抽样误差,抽样误差指随机性的代表性误差。,(一)抽样误差,抽样误差就是指随机误差,也就是按随机原,则抽样时,在没有登记性误差和偏差条件下,单,纯由于不同的随机样本得出不同的估计量,因而产,生的样本指标与总体指标之间的离差。,(3)抽样方法和组织形式的不同。,(二)抽样平均误差,在不重复抽样的条件下,2、抽样成数的平均误差,在重复抽样条件下,其计算公式为:,在不重复抽样条件下,其计算公式为:,(三)极限抽样误差,抽样极限误差是指样本指标与总体指标之间抽样误差的一种可能范围。即用一定的概率保证抽样误差不超过某一给定的最大可能范围,又叫置信区间。,样本指标是围绕着总体指标左右变动的,两者都可以用绝对值表示为|、|pP|。这种以绝对值表示的抽样误差的可能范围,就称为极限误差,或称为抽样误差范围和允许误差。,用符号“”表示,_ x为抽样平均数的极限误差;p 为抽样成数的极限误差,应用:用来和样本指标一起构成对总体指标的区间估计,四、抽样误差范围及其估计的可靠程度,(一)抽样误差范围及其估计的可靠程度,抽样推断的可靠程度就是指总体指标和样本指标之间的误差不超过一定范围的概率保证程度,或者说是总体指标落入置信区间的概率保证程度.,我们在进行抽样推断时,不但要考虑抽样误差的可能范围有多大,而且还必须考虑实际抽样误差落到这一范围的概率有多大,也即总体指标落入我们所计算出的估计区间的可能性有多大.前者推断的是准确性问题,后者推断的是可靠性问题,两者紧密联系不可分开.,抽样极限误差通常是以抽样平均误差作为标准来衡量的。用公式表示,即:,抽样极限误差也可以表示为抽样平均误差的若干倍,其倍数即是概率度。用公式表示如下:,从一个全及总体中连续进行多次抽样,可以得到一系列的样本,根据中心极限定理证明,不论全及总体是否属于正态分布,只要当抽样总体单位数足够多时,则抽样平均数的分布,逼近于全及平均数(或成数)为对称中心的正态分布。,(二)点估计和区间估计,点估计是以抽样得到的样本指标作为总体指标的估计值,同时给出极限误差和相应的可靠程度的一种估计方法。,区间估计是根据一定的精确度和可靠程度的要求,用样本指标和抽样误差去推断总体指标的可能范围的一种估计方法。,1、根据已经给定的极限抽样误差范围,求概率保证程度(),具体步骤是:,(1)抽取样本,计算样本平均数,作为总体平均数(或总体成数)的估计值,并计算样本标准差,以此推算抽样平均误差u。,()根据给定的抽样极限误差范围,估计总体平均数(或总体成数)的下限。,()将抽样极限误差除以抽样平均误差u求出概率度t值,再根据值查概率表求出相应的可信度()。,2、根据给定可信度()的要求来估计极限抽样误差的可能范围,具体步骤是:,()抽取样本,计算样本平均数作为总体平均数的估计值,并计算样本标准差,以此推算抽样平均误差u。,()根据给定的可信度()的要求,查概率表求得概率度值。,()根据概率度和抽样平均误差计算抽样极限 误差的可能范围,并据以计算被估计的总体平均 数的上、下限。,五、抽样数目的确定,(一)确定必要抽样数目的原则是:在保证预期的抽样推断可靠程度的要求下,抽取的样本单位数不宜过多。,1、总体被研究标志的变异程度;2、允许误差的大小;3、可靠程度的高低;4、抽样方法与组织形式的不同。,(二)决定抽样数目的因素:,5、人力、物力和财力的允许条件。,(三)必要抽样数目的计算,在简单随机抽样中,必要抽样数目的计算公式有:,1、在重复抽样条件下:,(1)平均数的必要抽样数目公式为:,()成数的必要抽样数目公式为:,、在不重复抽样条件下:,(1)平均数的必要抽样数目公式为:,()成数的必要抽样数目公式为:,第五节 抽样组织形式及其误差的计算,一、简单随机抽样,(一)简单随机抽样的概念和特点,简单随机抽样又称为纯随机抽样,它是完全按随机原则从总体所有单位中抽选出样本单位加以观察,保证总体的每个单位都有同等的机会被抽中,即按随机原则直接从含有个单位的总体中抽出n个单位组成样本。,从理论上讲,简单随机抽样最符合抽样调查的随机原则,是抽样调查最基本的形式。,简单随机抽样的特点是:方法简便,易于掌握;,局限性:当总体单位数目很大,标志变异程度也大时,则不宜采用。,(二)抽样方法,简单随机抽样通常是用抽签的方法抽取所要调查的单位。具体做法是:将总体各单位编号,然后随机抽取,直到抽够预定数目。可利用随机数表来抽样。,(三)误差计算,抽样平均误差,抽样极限误差,必要抽样数目的计算公式均适用于简单随机抽样.,二、类型抽样,(一)类型抽样的概念,类型抽样又称分类抽样或分层抽样,它是先将总体按主要标志进行分组(或分类),再按随机原则从各组中抽取样本单位的一种抽样组织形式。,(二)抽样方法,类型抽样的样本单位数在各类型之间的分配有两种方法:,1、不等比例类型抽样法。各类型的样本单位数,可以平均分配,或按各类型组标志变异程度确定应抽的单位数。标志变异程度大的组多抽一些单位;标志变异程度小的组就少抽一些。这样,各组的抽样比例是不相等的。,2、等比例类型抽样法。是按照类型的大小等比例分配样本单位的方法。即:,所以各组的样本单位数应为:,(三)类型抽样的误差计算,三、等距抽样,(一)等距抽样的概念,等距抽样又称为机械抽样或系统抽样,它是先将总体各单位按有关标志或无关标志进行排列,再按照固定的顺序和间隔来抽选样本单位的一种抽样组织形式。等距抽样是不重复抽样。,(二)抽样方法,1、无关标志排队法。是指总体单位采用与调查项目没有关系的标志进行排队的方法。无关标志排队法的具体工作比较简便,所以实际工作中经常应用。,如:产品质量检验抽选产品.,2、有关标志排队法。是指总体单位采用与调查项目有关的标志进行排队,并根据总体单位数和样本单位数计算出抽选间隔(或称抽选距离),然后按一定的间隔抽选样本单位。其计算公式为:,式中:k代表抽样距离,又称抽样间隔。,第一个样本单位的取得:,(1)如果是按无关标志排队,可以从第一个间隔内的任意一个单位开始抽取,,(2)如果是按有关标志排队,考虑到样本单位的代表性,一般是从第一间隔内居中的单位开始抽取。在实际工作中应用较多.,(三)等距抽样的误差计算,通常是用简单随机抽样的误差公式来计算按无关标志排队的等距抽样的平均误差;用类型抽样的误差公式来计算按有关标志排队的等距抽样的平均误差。,四、整群抽样,(一)整群抽样,整群抽样又称集团抽样,它是先将总体各单位划分成若干群,再以群为单位从中随机抽取出若干群来,对被抽中群的所有单位进行全面调查的一种抽样组织形式。如:社会现象.,优点:组织工作较为简便,确定一群便可以调查许多单位.,缺点:由于抽样比较集中,限制了样本单位在总体分配中的均匀性,所以代表性较低,抽样误差较大.通常需要增加样本单位.,(二)抽样方法,在组织整群抽样时,首先,对所要研究的全及总体根据需要划分出群的单位。其次,把各群按时间顺序或空间顺序排列编号。最后,可按简单随机抽样或等距抽样的方法抽取样本群。,(三)整群抽样的误差计算,整群抽样都采用不重复抽样的方法其计算公式为:,其中群间方差:,五、多阶段抽样,(一)多阶段抽样的概念,多阶段抽样是指在抽样时先从总体中抽取某种更大范围的单位,再从中选的大单位中抽取较小范围的单位,逐次类推,最后从更小范围单位中抽选样本的基本单位,分阶段完成抽样的组织工作。,当总体很大时,抽样调查要直接抽选总体的基本单位在技术上有很大困难,一般都要采用多阶段抽样方法。,多阶段抽样的特点:组织工作较复杂;样本的代表性较高;可节约人力、物力和财力。,特点:组织工作较复杂,但样本的代表性较高,可节约人力,物力,财力,因而在实际中得到广泛的应用.,(二)多阶段抽样的误差计算,在多阶段抽样中,前几个阶段的抽样,都类似整群抽样,最后一个阶段类似类型抽样或等距抽样。每个阶段抽样都会存在抽样误差,因此,多阶段抽样的抽样误差是各阶段抽样误差之和。,例如,两阶段抽样,第一阶段,从总体全部组R中抽取部分组r;第二阶段,抽取的部分组的全部单位M中抽取部分单位m。,两阶段抽样的平均误差是由两部分构成的:第一部分是第一阶段从总体全部组抽部分组所引起的组间误差;第二部分是由第二阶段中选的组中抽部分单位所引起的组内平均误差。样本平均方差应等于组平均数组间方差的 以及各组内方差平均数的 两项之和。,再考虑阶段抽样是不重置抽样,各项还必须乘以各自的修正系数,所以样本平均数的抽样平均误差u _ x为:,为组(群)平均数的组(群)间方差;,为各组(群)内方差的平均数。,应用以上公式,在得不到总体资料的情况下,可以用样本资料来代替。,若是更多个阶段抽样,则每增加一个阶段抽样,其抽样误差计算公式中便相应增加一项群的抽样误差。,