统计学课件-第七章抽样调查.ppt
《统计学课件-第七章抽样调查.ppt》由会员分享,可在线阅读,更多相关《统计学课件-第七章抽样调查.ppt(169页珍藏版)》请在三一办公上搜索。
1、2023/10/31,课件,1,第七章 抽样调查,第一节 抽样调查的意义,第二节 总体和样本,第三节 抽样调查的数理基础,【学习目标】通过本章学习,通过对本章的学习,重点掌握参数估计和假设检验的方法;掌握抽样调查的基本概念和数理基础的核心内容;了解抽样调查的意义和抽样组织设计的应用。重点与难点:抽样平均误差的计算;抽样推断的优良标准;总体平均数、总体成数的和总体方差的检验;类型抽样设计和推断方法。,第五节 抽样设计,第四节 总体参数估计,第六节 总体假设检验,2023/10/31,课件,2,第一节 抽样调查的意义,一、抽样调查的概念和特点,(一)抽样调查的概念,抽样调查是一种科学的非全面调查。
2、它是按照随机原则从调查对象的总体中抽取部分单位进行调查,并根据这部分单位的调查结果推断总体的数量特征。,抽样调查必须按照随机原则来抽取被调查单位。,第七章 抽样调查,2023/10/31,课件,3,第一节 抽样调查的意义,(二)抽样调查的特点,1.随机抽取样本单位,2.推断总体数量特征,3.抽样调查结果只有可控性误差,第七章 抽样调查,2023/10/31,课件,4,第一节 抽样调查的意义,二、抽样调查的应用范围,1.用于不可能进行全面调查的现象,2.用于进行全面调查就会失去现实意义的现象,3.用于经济上不允许或精度上 不必要进行全 面调查的现象,4.用于时效性要求较强的调查,第七章 抽样调查
3、,2023/10/31,课件,5,第一节 抽样调查的意义,三、抽样调查的作用,1.经济性好,2.准确性高,3.速度快,4.可以取得比较详细的统计资料,5.可以对全面调查的资料进行补充和修正,第七章 抽样调查,2023/10/31,课件,6,第二节 总体和样本,一、全及总体和样本总体,(一)全及总体,也叫母体,简称为总体。,(二)抽样框,在实际进行抽样的总体范围内,包括全部抽样单位的名单框架称为抽样框。抽样框的主要形式有三种:名单抽样框 区域抽样框 时间表抽样框。,第七章 抽样调查,2023/10/31,课件,7,区域抽样框,在商场的大门口,在微波炉柜台前,在市区街道旁边,在某个住宅小区,中山路
4、桥西区桥东区华北地区东北地区居民一组居民二组,某外国公司在大连进行微波炉市场调查:,2023/10/31,课件,8,时间表抽样框,连续出产的产品总体可以编制抽样框:均匀的出产时间、可以预见到的产品总量。,连续到加油站加油的汽车总体无法编制抽样框:时间不定、总量也无法确定。,2023/10/31,课件,9,第二节 总体和样本,(三)样本总体,样本总体,又叫子样,简称样本(sample)。它是从全及总体中随机抽取出来(具体是从抽样框中抽取出来的),用来代表全及总体的那部分单位构成的总体。,样本总体的单位数称为样本容量,通常用小写字母n来表示。,样本容量n与总体单位数N的比值()称为抽样比。,样本容
5、量n在30以下时,称为小样本;达到或超过30时称为大样本。,第七章 抽样调查,2023/10/31,课件,10,第二节 总体和样本,二、总体指标和样本指标,(一)总体指标,总体指标是根据全及总体所有单位的标志值计算出来的,反映总体的数量特征。,总体指标也称为总体参数(Parameter),或参数。,。,总体指标主要有:总体平均数:,总体方差:,总体标准差:,总体比率(或),第七章 抽样调查,2023/10/31,课件,11,第二节 总体和样本,(二)样本指标,由样本总体各个单位的标志值计算的综合指标称为样本指标,样本指标又称为样本统计量(Statistic),简称为统计量。,样本指标主要有:样
6、本平均数:,样本方差:,样本标准差:,样本比率(或),第七章 抽样调查,2023/10/31,课件,12,第二节 总体和样本,三、抽样方法和样本可能数目,(一)抽样方法,1.重复抽样,重复抽样(sampling with replacement)也叫重置抽样,是指每次抽取一个单位记录其标志表现后又放回,重新参加下一次的抽选。,2.不重复抽样,不重复抽样(sampling without replacement)也叫不重置抽样,是指每次从总体中抽取一个单位记录其标志表现后不再放回,从剩余的单位中抽取下一个单位。,第七章 抽样调查,2023/10/31,课件,13,第二节 总体和样本,(二)样本可
7、能数目,样本可能数目是指抽样组织和抽样方法一定时,从总体N个单位中随机抽取一个容量为n的样本,该样本不同构成的可能数目,一般用m来表示。,1.重复抽样的样本可能数目(通常为考虑单位排列顺序),2.不重复抽样的样本可能数目(通常为考虑单位排列顺序),第七章 抽样调查,2023/10/31,课件,14,第三节 抽样调查的数理基础,一、抽样分布,抽样分布(sampling distribution)就是指样本统计量的概率分布。,例如,设总体有3名学生A、B和C,他们的考试成绩分别为5分、4分和3分。,现在采用抽样调查方法抽取其中的2名学生作为样本,了解这3名学生的平均成绩。,样本统计量为:,第七章
8、抽样调查,2023/10/31,课件,15,第三节 抽样调查的数理基础,若采用重复抽样,样本构成情况如下表所示。,重复抽样的样本统计量取值情况,第七章 抽样调查,2023/10/31,课件,16,第三节 抽样调查的数理基础,重复抽样的样本统计量分布表,第七章 抽样调查,2023/10/31,课件,17,第三节 抽样调查的数理基础,二、大数定律及其意义,大数定律是阐述大量随机变量的平均结果具有稳定性的一系列定律的总称。,1.独立同分布大数定律,独立随机变量 具有相同分布,且存在有限的数学期望 和方差,则对于任意小的正数,有,第七章 抽样调查,2023/10/31,课件,18,第三节 抽样调查的数
9、理基础,2.贝努力大数定律,设m是 n 次独立随机试验中事件A发生(“成功”)的次数,p是事件A在每次试验中发生的概率,则对于任意小的正数,有,大数定理从理论上揭示了样本和总体之间的内在联系,即随着抽样单位数n的增大,样本平均数(或比率)有接近于总体平均数(或比率)的趋势。,第七章 抽样调查,2023/10/31,课件,19,第三节 抽样调查的数理基础,大数定律可归纳如下:,1)现象的某种总体性规律(或称统计规律),只有当具有这种现象的足够多数的单位综合汇总在一起的时候,才能显示出来。因此,只有从大量现象的总体中,才能研究这些现象的规律性。2)现象的总体性规律或倾向通常是以平均数(或比率)的形
10、式表现出来的。3)当所研究的现象总体包含的单位越多,平均数(或比率)也就越能够正确反映出这些现象的规律性。,第七章 抽样调查,2023/10/31,课件,20,第三节 抽样调查的数理基础,4)各单位的共同倾向(这些表现为主要的、基本的因素)决定着平均数(或比率)的水平,而各单位对平均数(或比率)的离差(这些表现为次要的、偶然的因素)则会由于足够多数单位的综合汇总的结果,而相互抵消,趋于消失。,大数定律可归纳如下:,根据大数定律的内容特点,运用抽样法时,必须注意以下两个问题:,第一、抽样必须遵循随机原则。,第二、抽样必须遵循大量原则。,第七章 抽样调查,2023/10/31,课件,21,第三节
11、抽样调查的数理基础,三、正态分布及其意义,(一)正态分布的概念及其特点,1.正态分布的概念,正态分布的分布密函数为:,x为随机变量,e为自然对数的底,为圆周率,为变量x的平均数,为变量标准差。,第七章 抽样调查,2023/10/31,课件,22,第三节 抽样调查的数理基础,2.关于密度函数 的二个参数 和,平均数 决定密度函数 的中心位置。,第七章 抽样调查,2023/10/31,课件,23,第三节 抽样调查的数理基础,标准差 决定密度函数曲线 的陡缓程度,第七章 抽样调查,2023/10/31,课件,24,第三节 抽样调查的数理基础,3.正态分布密度函数的特点,1)对称性。,2)非负性。,3
12、)在 时达到极大值,4)的曲线在 处有拐点。,5)当 时,的曲线以x轴为渐近线。,第七章 抽样调查,2023/10/31,课件,25,第三节 抽样调查的数理基础,4.标准正态分布,标准正态分布的概率密度为:,若随机变量 服从标准正态分布,则记为它具有如下性质或结论。,第七章 抽样调查,2023/10/31,课件,26,第三节 抽样调查的数理基础,(二)正态分布的应用,求正态变量的概率,通常是先将一般正态变量转换为标准正态变量,然后从标准正态分布概率表中查出相应标准正态变量值所对应的分布函数值,再计算出所求正态变量研究区间的概率。,第七章 抽样调查,2023/10/31,课件,27,第三节 抽样
13、调查的数理基础,(二)正态分布的应用,部分常用z值和相应概率值,第七章 抽样调查,2023/10/31,课件,28,第三节 抽样调查的数理基础,四、中心极限定理及其意义,中心极限定理论证了如下几点:,1)如果总体服从正态分布,样本平均数也同样服从正态分布。,2)如果总体很大,但不服从正态分布,只要样本足够大,样本的总和或平均数就会趋近于正态分布。,。,3)样本平均数分布的数学期望(该抽样的所有可能样本平均数的均值)等于总体均值。即。,第七章 抽样调查,2023/10/31,课件,29,第四节 总体参数估计,第七章 抽样调查,一、参数估计的优良标准,(一)无偏性,(二)有效性,(三)一致性,20
14、23/10/31,课件,30,评价准则,的数学期望等于总体参数,即,该估计量称为无偏估计,无偏性,有效性,当 为 的无偏估计时,方差 越小,无偏估计越有效。,一致性,对于无限总体,如果对任意,则称 是,的一致估计。,估计量,第七章 抽样调查,2023/10/31,课件,31,第四节 总体参数估计,第七章 抽样调查,二、抽样误差,(一)抽样误差的意义,1.抽样误差的概念,抽样调查过程中的误差根据其来源大体上可以归纳为两类:一类是登记性误差,另一类是代表性误差。,代表性误差包括系统误差和随机误差两种。,2023/10/31,课件,32,第四节 总体参数估计,第七章 抽样调查,2.影响抽样误差的因素
15、,1)总体变异度,2)样本容量,3)抽样方法,4)抽样组织方式,2023/10/31,课件,33,第四节 总体参数估计,抽样平均误差一般如下公式表示:,为第 可能样本的平均数,为总体平均数,是样本可能数目,第七章 抽样调查,(二)抽样平均误差,1.概念:抽样平均误差是指所有可能样本的估计值与所要估计参数离差的平均数。,2023/10/31,课件,34,第四节 总体参数估计,2.抽样平均误差的计算,1)样本平均数的抽样平均误差,重复抽样情况下:,不重复抽样情况下:,第七章 抽样调查,2023/10/31,课件,35,第四节 总体参数估计,2)样本比率的抽样平均误差,在重复抽样情况下:,在不重复抽
16、样情况下:,第七章 抽样调查,2023/10/31,课件,36,第四节 总体参数估计,(三)抽样极限误差,在一次抽样中允许的最大误差范围称为抽样极限误差。是变动的抽样指标与唯一确定的但又是未知的全及指标之间离差的可能范围。,设x与p分别表示样本平均数与样本比率的抽样极限误差,则有:,第七章 抽样调查,2023/10/31,课件,37,第四节 总体参数估计,抽样极限误差通常需要以抽样平均误差为标准单位来加以衡量,把抽样极限误差除以相应的抽样平均误差,得出数值z,以表明抽样极限误差是抽样平均误差的多少倍。,在概率统计中,z称为概率度。其计算公式为:,第七章 抽样调查,2023/10/31,课件,3
17、8,第四节 总体参数估计,为了表示抽样误差的相对程度,需要计算抽样误差系数 和,由抽样误差系数还可以计算抽样估计精度(Ax或Ap)。,第七章 抽样调查,2023/10/31,课件,39,第四节 总体参数估计,三、抽样估计的置信度,抽样估计时总体参数落在某个区间的概率保证程度称为抽样估计的置信度。,抽样估计的置信度(confidence interval)和抽样极限误差有着密切联系。当抽样极限误差范围增大时,抽样估计的置信度也随之有规律地增大,抽样估计的精确程度则随之有规律地降低,反之亦然。,第七章 抽样调查,2023/10/31,课件,40,第四节 总体参数估计,四、点估计与区间估计,点估计也
18、称定值估计,它是以样本指标的计算结果作为总体参数估计的结果,即用样本指标值直接作为全及总体指标的代表值。,(一)点估计,用于点估计的估计量一般应满足优良估计量三个标准。,第七章 抽样调查,2023/10/31,课件,41,第四节 总体参数估计,(二)区间估计,区间估计就是根据样本估计量以一定可靠程度推断总体参数所在的区间范围。,区间估计有三项基本要素:估计值,主要是样本的平均数、比率和方差;估计值的可能误差范围(或说允许误差范围),即抽样极限误差 和;与误差范围相对应的概率保证程度参数估计的置信度。,第七章 抽样调查,2023/10/31,课件,42,第四节 总体参数估计,(二)区间估计,这三
19、个要素之间的关系可表示如下:,第七章 抽样调查,2023/10/31,课件,43,第四节 总体参数估计,五、总体平均数估计,(一)大样本的总体平均数估计,第七章 抽样调查,表达式,其中,为极限误差,2023/10/31,课件,44,步骤,计算样本平均数;,搜集总体方差的经验数据;或计算样本标准差,即,第七章 抽样调查,2023/10/31,课件,45,计算抽样平均误差:,重复抽样时:,不重复抽样时:,计算抽样极限误差:,确定总体平均数的置信区间:,2023/10/31,课件,46,第四节 总体参数估计,五、总体平均数估计,(一)大样本的总体平均数估计,例:某企业生产A产品的工人有1000人,某
20、日采用不重复抽样从中随机抽取100人调查他们的当日产量,样本人均产量为35件,产量的样本标准差为4.5件。请以95.45%的置信度估计该日人均产量的置信区间。,第七章 抽样调查,2023/10/31,课件,47,第四节 总体参数估计,解:计算抽样平均误差,计算抽样极限误差,由,查正态概率表得,第七章 抽样调查,2023/10/31,课件,48,第四节 总体参数估计,确定置信区间,估计区间上限:(件),估计区间下限:(件),第七章 抽样调查,故,可以95.45%的置信度断言,该日人均产量在34.1535.85件之间。,2023/10/31,课件,49,【例A】某企业生产某种产品的工人有1000人
21、,某日采用不重复抽样从中随机抽取100人调查他们的当日产量,要求在95的概率保证程度下,估计该厂全部工人的日平均产量和日总产量。,第七章 抽样调查,2023/10/31,课件,50,100名工人的日产量分组资料,2023/10/31,课件,51,解:,第七章 抽样调查,2023/10/31,课件,52,则该企业工人人均产量 及日总产量 的置信区间为:,即该企业工人人均产量在124.797至127.203件之间,其日总产量在124797至127303件之间,估计的可靠程度为95。,第七章 抽样调查,2023/10/31,课件,53,【例B】某乡水稻总面积20000亩,以不重置抽样方法从中随机抽取
22、400亩实割实测求得样本平均亩产645公斤,标准差72.6公斤。要求极限误差不超过7.2公斤,试对该乡水稻的亩产和总产量作估计。,第七章 抽样调查,2023/10/31,课件,54,第一步:计算抽样平均误差,第二步:计算平均亩产和总产量的上下限,亩产下限=645-7.2=637.8(公斤),亩产上限=645+7.2=652.2(公斤),第七章 抽样调查,2023/10/31,课件,55,第三步:计算概率度,总产量下限=20000637.8=1275.6(公斤),总产量上限=20000652.2=1304.4(公斤),以95.45%保证该乡水稻平均亩产在637.8至652.2公斤之间,总产量在1
23、275.6至1304.4万公斤之间。,第七章 抽样调查,2023/10/31,课件,56,第四节 总体参数估计,(二)小样本的总体平均数估计,第七章 抽样调查,例:某商场从一批袋装食品中随机抽取10袋,测得每袋重量(单位:克)分别为789、780、794、762、802、813、770、785、810、806,要求以95%的把握程度,估计这批食品平均每袋重量的区间范围。,若,当方差 未知,时,简单随机样本的平均数 服从自由度为 的 分布,即,2023/10/31,课件,57,第四节 总体参数估计,第七章 抽样调查,解:计算样本指标,计算抽样平均误差,2023/10/31,课件,58,第四节 总
24、体参数估计,第七章 抽样调查,计算抽样极限误差,由,查t分布表得,,确定置信区间,估计区间上限:(克),估计区间下限:(克),故,在95%的置信度下,这批食品平均每袋重量的置信区间是778.8803.4克。,2023/10/31,课件,59,第四节 总体参数估计,第七章 抽样调查,六、总体比率估计,总体比率P是总体是非标志的的平均数,前面讲的平均数估计理论都适用于总体比率P的估计,只是估计量的形式略有不同。,表达式,其中,为极限误差,2023/10/31,课件,60,第七章 抽样调查,步骤,计算样本成数;,搜集总体方差的经验数据;,计算抽样平均误差:,重复抽样条件下,不重复抽样条件下,2023
25、/10/31,课件,61,计算抽样极限误差:,确定总体成数的置信区间:,第七章 抽样调查,2023/10/31,课件,62,【例B】若例A中工人日产量在118件以上者为完成生产定额任务,要求在95的概率保证程度下,估计该厂全部工人中完成定额的工人比重及完成定额的工人总数。,第七章 抽样调查,2023/10/31,课件,63,第七章 抽样调查,100名工人的日产量分组资料,完成定额的人数,幻灯片 47,2023/10/31,课件,64,解:,第七章 抽样调查,2023/10/31,课件,65,第七章 抽样调查,则该企业全部工人中完成定额的工人比重 及完成定额的工人总数 的置信区间为:,即该企业工
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 课件 第七 抽样调查
链接地址:https://www.31ppt.com/p-6440892.html