《抽样推断》PPT课件.ppt
2023/7/15,1,第七章 抽样推断,第一节 抽样推断概述第二节 抽样误差第三节 抽样估计第四节 必要样本单位数的确定,教学目的,通过对本章的学习,了解抽样估计的基本原理,掌握抽样估计的基本方法。能够在抽样调查的基础上,对调查总体作出较为准确的抽样推断。,2023/7/15,2,如果你去市场买水果,水果摊上有一大堆西桔子,摊住告诉你:可以挑,一块一斤;不许挑,七毛一斤。你会如何决择?,请思考,2023/7/15,3,统计调查方法,全面调查,非全面调查,普 查,抽样调查,重点调查,典型调查,相关知识回顾:,统计报表,2023/7/15,4,社会,抽样,推断,总体,样本,抽样推断是在抽样调查的基础上,利用样本的实际资料计算样本指标,并据以推算总体相应数量特征的一种统计分析方法。,一、抽样推断的含义,第一节 统计推断概述,2023/7/15,5,(3)抽样误差是可以事先计算并加以控制;,二、抽样推断的特点,第一节 统计推断概述,总 体(全部),样 本(部分),随机抽样,推断,(1)按随机原则从总体中抽取调查单位;,(2)用抽样指标推断总体的数量特征;,2023/7/15,6,了解对某些不可能进行全面调查的现象了解某些不必须或不允许全面调查的现象需要及时了解情况的现象对全面调查的资料进行评价和修正对工业生产过程进行质量控制,三、抽样推断的作用,第一节 统计推断概述,2023/7/15,7,总体也称全及总体,指所要认识的研究对象全体,由具有某种共同性质许多单位组成的集合体,一般用N表示。包括无限总体和有限总体。,总 体N(唯一),样 本n(非唯一),四、抽样推断中的基本概念,第一节 统计推断概述,(一)总体和样本,样本又称子样,是从全及总体中随机抽取出来,作为代表 这一总体的那部分单位组成的集合体,一般用n表示。,2023/7/15,8,总体指标是根据总体各单位的标志值或标志特征计算的,反映总体数量特征的综合指标,称为全及指标,由总体各单位的标志值或标志特征所决定,全及指标的指标值是确定的,唯一的,所以又称为参数。,四、抽样推断中的基本概念,第一节 统计推断概述,(二)总体指标和样本指标,计算样本指标,总 体N,样 本n,抽样,推断,总体指标,2023/7/15,9,常见的总体指标,X:表示总体变量,有N个单位,所以可以表示为:,对于总体的数量标志,经常计算的总体指标有总体平均数 和总体方差,第一节 统计推断概述,2023/7/15,10,对于总体中的品质标志:由于不能用数量来表示,总体参数通常用成数P表示。成数:总体中具有某种性质的单位数在总体全部单位数中的比重,用P表示。总体中不具有某种性质的单位数在总体中所占的比重,用Q表示,即:P+Q=1,总体指标,第一节 统计推断概述,2023/7/15,11,当某种标志,它的标志表现只有是非两种,可 以用“1”表示标志表现为“是”的标志的标志表现,“0”表示标志表现为“非”的标志的标志表现,在此情况下,可以计算总体成数的平均数 和方差,总体指标,第一节 统计推断概述,2023/7/15,12,例题:某批产品共500件,合格品480件,不合格品20件,要求计算成数合格品率、,第一节 统计推断概述,成数计算,2023/7/15,13,样本指标根据样本各单位标志值或标志属性计算的综合指标,又称为统计量。样本统计量是用来估计总体参数的,不是唯一固定的。反映样本的数量特征。与总体指标相对应,包括以下常用指标:,样本指标,样本平均数:,样本成数:,样本方差:,第一节 统计推断概述,2023/7/15,14,样本个数,样本容量,是一个样本所包含的单位数,用n表示,有小样本和大样本,是从总体中所有可能被抽取的样本数目,第一节 统计推断概述,四、抽样推断中的基本概念,(三)样本容量与样本个数,2023/7/15,15,不重复抽样,重复抽样,第一节 统计推断概述,四、抽样推断中的基本概念,(四)重复抽样与不重复抽样,从总体中每次抽取一个单位登记后不再重新放回总体中,不参加下次抽样,从总体中每次抽取一个单位登记后再重新放回总体中,参加下次抽样,2023/7/15,16,不同抽样方法的样本个数,抽样方法,重复抽样,不重复抽样,考虑顺序,不考虑顺序,考虑顺序,不考虑顺序,结论:总体单位数一致,在相同样本容量的情况下,重复抽样的样本个数大于不重复抽样的样本个数。,2023/7/15,17,简单随机抽样,第一节 统计推断概述,五、抽样组织方式,将总体按某一标志进行分组,然后在每组中随机抽取所需的样本单位,类型抽样,等距抽样,整群抽样,多阶段抽样,按随机原则直接从总体中抽取样本,使样本每个单位被抽取的机会相同,将总体各单位按一定顺序排队,然后按固定顺序或间隔抽取样本单位,将总体单位分为若干群,按随机原则抽取一些群,将抽中群的全部单位组成样本,将抽样过程分为两个或两以上的阶段进行抽取,不同阶段可能用不同的组织方式进行抽样,2023/7/15,18,第二节 抽样误差,一、抽样误差的含义,抽样误差是在随机抽样的前提下,由于随机抽样的偶然因素使样本内部结构与总体结构有差异,而引起样本指标和总体指标之间的绝对离差。,抽样误差,平均数的抽样误差,成数的抽样误差,2023/7/15,19,调查误差,登记性误差:登记、遗漏、计算、作假,代表性误差,系统性误差:重点调查、典型调查,随机误差:抽样调查,第二节 抽样误差,二、抽样误差的特点,系统性误差与登记性误差可以防止或避免,抽样误差是一种随机误差,是不可避免的,只能加以控制。,2023/7/15,20,第二节 抽样误差,三、抽样平均误差,抽样平均误差是反映抽样误差一般水平的指标。是所有可能出现的样本指标和总体指标的平均离差,也就是样本指标的标准差。,如用重复抽样的方法,从5、7、9三个数中抽两个数构成样本,求样本的平均值,用以代表三个数的一般水平,所有可能的样本以及样本的平均值列表如下:,例题,2023/7/15,23,几个基本关系:a.样本平均数的平均数等于总体平均数;,b.抽样平均误差实质上就是抽样平均数的标准差,也称为抽样标准误差;,c.抽样平均数的标准差(抽样平均误差)比总体标准差小很多,仅为总体标准差的。,d.可以通过调整样本单位数n来控制抽样平均误差。,第二节 抽样误差,2023/7/15,24,抽样平均误差的计算,样本平均数的平均误差,不重复抽样,重复抽样,样本成数的平均误差,第二节 抽样误差,2023/7/15,25,总体的差异程度,样本单位数,抽样方法,抽样组织形式,总体的差异程度与平均误差成正比,样本单位数与平均误差成反比,重复抽样的平均误差大于不重复抽样的平均误差,类型抽样和等距抽样的误差较小,整群抽样的误差较大,影响抽样平均误差因素,第二节 抽样误差,2023/7/15,26,抽样极限误差指根据抽样推断结果的精确度和可靠性要求确定的样本指标与总体指标之间误差的最大允许范围,也称为允许误差或容许误差。,第二节 抽样误差,四、抽样极限误差,2023/7/15,27,五、抽样误差的概率度,第二节 抽样误差,2023/7/15,28,t F(t)t=1 F(t)=68.27%t=1.64 F(t)=90%t=1.96 F(t)=95%t=2 F(t)=95.45%t=3 F(T)=99.73%,概率保证程度,对于抽样极限误差不超过一定范围的概率,即计算样本指标落在一定区间范围内的概率,概率保证程度与概率度之间呈正态分布,六、抽样推断的概率保证程度,第二节 抽样误差,2023/7/15,29,点估计以样本指标的实际值直接作为相应总体指标的估计值,即直接以样本平均数、成数推断总体的平均数和成数。,第三节 抽样估计,一、点估计,2023/7/15,30,1计算样本指标 或 p,计算抽样平均误差 或2根据抽样误差范围,进行总体指标的区间估计:3根据给定的抽样误差范围,求概率度,查表求 概率保证程度F(t),模式一,给定抽样误差范围,第三节 抽样估计,二、区间估计,2023/7/15,31,1计算样本指标 或 p,计算抽样平均误差 或2根据给定的概率保证程度F(t),查表求t3根据t求误差范围,对总体指标进行区间估计:,模式二,给定概率保证程度,第三节 抽样估计,二、区间估计,1计算样本平均数 计算样本平均数的标准差计算抽样平均数的平均误差 2根据给定的概率保证程度F(t),得概率度t3根据t求误差范围 4.对总体平均指标进行区间估计:,总体平均数的区间估计(模式二),1计算样本成数 计算抽样成数的平均误差 2根据给定的概率保证程度F(t),得概率度t3根据t求误差范围 4.对总体成数进行区间估计:,总体成数(比率p)的区间估计(模式二),2023/7/15,34,直接关系到抽样误差大小,影响到抽样推断的效果,影响到抽样调查的成本,样本单位数越多,抽样误差越小,抽样单位数越多,抽样效果越好,抽样单位数越多,调查成本越大,一、确定必要样本单位数的意义,第四节 必要样本单位数的确定,2023/7/15,35,重复抽样,不重复抽样,推断总体平均数所需的样本单位数,推断总体成数所需的样本单位数,二、必要样本单位数的确定,第四节 必要样本单位数的确定,2023/7/15,36,总体标准差,抽样极限误差,抽样方法,抽样组织形式,总体标准差与样本单位数成正比,抽样极限误差与样本单位成反比,重复抽样所需的样本单位数大于不重复抽样的样本单位数,类型抽样所需的样本单位数较少,整群抽样所需的样本单位数较多,第四节 必要样本单位数的确定,三、必要样本单位数的影响因素,