第5章抽样调查12课件.ppt
《第5章抽样调查12课件.ppt》由会员分享,可在线阅读,更多相关《第5章抽样调查12课件.ppt(107页珍藏版)》请在三一办公上搜索。
1、第五章,9/24/2022,第五章9/24/2022,本 章 内 容,第一节 抽样调查概述,第二节 抽样调查的数理基础,第三节 抽样误差与参数估计,第四节 抽样调查的组织方式,9/24/2022,本 章 内 容第一节 抽样调查概述第二节 抽样调查的数理基,综合指标,总量指标,相对指标,平均指标,变异指标,反映总体数量特征,如何取得总体指标数据?一是通过全面调查方式,如普查、全面统计报表等。二是通过抽样调查(即抽样推断)方式。,9/24/2022,综合指标总量指标相对指标平均指标变异指标反映总体数量特征如何,.,第一节 抽样调查概述,一、抽样调查的概念、特点及作用 二、抽样调查中的基本概念 三、
2、抽样调查的一般步骤,9/24/2022,.第一节 抽样调查概述 一、抽样调查的概念、特,(一)抽样调查的概念(二)抽样调查的特点(三)抽样调查的应用场合(四)抽样调查推断总体的两种类型,一、抽样调查的概念、特点及作用,9/24/2022,(一)抽样调查的概念 一、抽样调查的概念、特点及作用9,抽样调查是以概率论和数理统计理论为基础,按照随机原则从调查总体中抽取一部分单位作为样本进行调查,再用样本数值,对总体数量特征作出具有一定可靠程度的推断。也称为抽样推断、抽样估计或统计推断,是一种非全面调查。,,,(一)抽样调查的概念,9/24/2022,抽样调查是以概率论和数理统计理论为基础,按照随机原则
3、从调,抽样,样本,n=100,总体,N=10000,推断,(总体指标),(样本指标),【例】要得到某厂生产10000只灯泡的平均耐用时间,就只能采用抽样调查的方法,从中随机抽取100只灯泡组成样本,对样本进行检验。,9/24/2022,抽样 样本n=100总体N=10000推断(总体指标),(二)抽样调查的特点,实施随机抽样的原因:能使样本分布与总体分布相同或相近,使样本代表性变强。能使样本统计量成为具有一定分布规律的随机变量,可以根据样本统计量的分布规律,运用概率理论对抽样调查结果的误差进行计算和评价。,2、调查目的是根据样本指标来推断总体;3、在调查之前可以计算出抽样误差和控制大小;4、运
4、用概率对总体进行估计和推断。,1、实施随机抽样,即按照随机原则从总体中抽取样本,使各个调查单位被抽中的概率相等。,9/24/2022,(二)抽样调查的特点实施随机抽样的原因:2、调查目的是根据,(三)抽样调查的应用用于不能用全面调查方式进行调查的现象。,用于通过全面调查后结果将失去意义的现象。,如调查某地区的矿藏、某城市的空气质量等。,如炮弹射程的测量,电视、灯泡等耐用时数的检验等属于破坏性调查。,用于经全面调查后成本过高或调查精度要求不高的现象。,如某市居民家计调查,某林区的木材储存量调查等。,9/24/2022,(三)抽样调查的应用用于通过全面调查后结果将失去意义的现象,用于调查时效性要求
5、较强的现象。,如为满足领导机关及时制订政策、安排工作需要而进行的民意测验,某农产品的产量调查等。,1994年,我国确立了以周期性普查为基础,以经常性抽样调查为主体,同时辅之以重点调查、科学核算等综合运用的统计调查方法体系,抽样调查的主体方法地位得以正式确立。,5.用于修正全面调查的结果。,如在人口普查结束后,运用抽样调查的方法对普查结果进行修正等。,9/24/2022,用于调查时效性要求较强的现象。如为满足领导机关及时制订政,(四)抽样调查推断总体的两种类型一类是参数估计:研究的是用样本指标(统计量)估计总体指标(参数)的方法。一类是假设检验:它是先对总体参数或特征提出一个假设,然后利用样本信
6、息去检验这个假设是否成立。如果成立,就接受这个假设;如果不成立,就放弃这个假设。例:,【例】对可口可乐公司生产的一种瓶装雪碧产品进行检查,包装上标明其净含量是500ml。在市场上随机抽取了50瓶,测得到其平均含量为499.5ml,标准差为2.63ml。根据这些数据可以进行:,一是参数估计:用95%的概率保证,该种包装的雪碧平均含量在498.77-500.23ml之间;,二是假设检验:根据样本数据结合统计分布规律,对“该种瓶装雪碧重量不符合所标明的重量”假设进行否定或肯定。,9/24/2022,(四)抽样调查推断总体的两种类型【例】对可口可乐公司生产的一,二、抽样调查中的基本概念,(一)抽样调查
7、中常用的指标(二)抽样方法(三)抽样框(四)样本的可能个数,9/24/2022,二、抽样调查中的基本概念(一)抽样调查中常用的指标9/2,总体:即根据研究目的确定的所要研究的同类事物的全体,也称为全集总体、母体。总体单位:组成总体的各个单位,也称为个体或子体。总体容量:总体单位的总数,一般用“N”表示。,1、总体与总体指标,9/24/2022,总体:即根据研究目的确定的所,总体参数的具体形式见后表:抽样调查中常用的指标,总体指标,或总体参数:它是用来反映总体数量特征的指标。,总体,是唯一确定的,注意:由于总体是唯一确定的,所以总体指标也是唯一确定的,但又是未知的,需要用样本指标来估计。,总体参
8、数,9/24/2022,总体参数的具体形式见后表:抽样调查中常用的指标总体指标,或总,总体,是唯一确定的,样本:也称为抽样总体,是从总体中按随机原则抽取出来的一部分单位的组成集合体,作为总体的代表。,样本容量:样本中包含的单位数,一般用n表示。n30为大样本,n30为小样本,样本k,由于抽样方法和样本容量的不同,从一个总体中可以抽出许多个不同的样本。在实际调查时,一般只从总体中抽取一个或几个样本进行调查,哪一个样本被抽到完全是随机的。,2、样本与样本指标,不是唯一确定的,9/24/2022,总体是唯一确定的 样本:也称为抽样总,样本指标是随机变量,它会随着样本的不同而有不同的取值。,样本指标,
9、也称为样本统计量、估计量:是根据样本中各个单位数据计算的反映样本特征的指标。,抽样调查中常用的指标:总量指标 平均数(均值)方差或标准差 成数或比例(是非标志比重)(计算公式见下表),注意:总体指标(参数)和样本指标(统计量)是一一对应的。,9/24/2022,样本指标是随机变量,它会随着样本的不同而有不同的取值。样本指,是唯一确定的,是随机变量,它会随着样本的不同而有不同的取值,总体平均 数,总体标准 差,样本平均 数,样本标准 差,总体平均 数,总体标准 差,样本平均 数,总体成数,样本标准 差,变量总体,属性总体,性质,变量样本,属性样本,性质,表5-1 抽样调查中常用指标及计算公式,9
10、/24/2022,参数(总体指标),(二)抽样方法,重复抽样 不重复抽样,9/24/2022,(二)抽样方法 重复抽样9/24/2022,1、重复抽样,即指要从总体的N个单位中随机抽取一个单位数为n的样本,每次抽出一个单位记录其特征后,再放回总体中参加下一次抽选。这样连续抽n次即得到所需样本。,(即每次抽取是独立的,条件相同),(重置抽样,有放回的抽样),9/24/2022,1、重复抽样 即指要从总体的N个单位中随机抽取一个单位数,2、不重复抽样(不重置抽样,无放回的抽样),即每次从总体N个单位中随机抽出一个单位后,就不再放回总体中,下一个样本单位再从余下的总体单位中抽取。这样连续抽n次即得到
11、一个单位数为n的样本。,(即每次抽取不是独立的,条件不同),9/24/2022,2、不重复抽样(不重置抽样,无放回的抽样)即每次从总体N,概率抽样(随机抽样):是指按照随机原则抽取样本单位。,非概率抽样(非随机抽样):是指调查单位的抽取是非随机的。重点调查、典型调查、方便抽样中单位的选取就属于非随机抽样形式。在抽样调查中有时也采用非概率抽样方式抽取样本。,此外,从抽取样本的随机性看,分为两类形式:,9/24/2022,概率抽样(随机抽样):是指按照随机原则抽取样本单位,抽样框是包括全部总体单位名单的框架。实施概率抽样必须具备抽样框。,抽样框的形式有:,名单抽样框:列出全部单位名单的一览表。,区
12、域抽样框:按地理位置将总体范围划分为若干小的 区域,以小区域为抽样单位。,时间表抽样框:将总体全部单位按时间顺序排列,把总 体的时间分为若干小段时间,以各个小 段的时间单位为抽样单位。,(三)抽样框,9/24/2022,抽样框是包括全部总体单位名单的框架。抽样框的形式有:名,(四)样本的可能个数它是指从总体N个单位中随机抽选n个单位构成样本,结果有排列组合,一种排列组合便构成一个可能的样本,排列组合的总数称为样本的可能个数。,【例】假设总体有A、B、C、D、E五个单位,现纯随机重复抽取2个单位组成样本,求全部可能样本个数。,(N=5 n=2),9/24/2022,(四)样本的可能个数【例】假设
13、总体有A、B、C、D、E五个,(1)在 n 次抽样中,总体每个单位在各次抽样中被抽取的概率都相同(即均为 1N);,重复抽样的特点:,(2)共可组成 个样本,每个样本在各次抽样中被抽取的概率都相同(即均为1k)。,(抽后放回),第二次抽取:,则所有可能的样本个数为:,AA AB AC AD AE BA BB BC BD BECA CB CC CD CEDA DB DC DD DE EA EB EC ED EE,即:,第一次抽取:,解:,9/24/2022,(1)在 n 次抽样中,总体每个单位在各次抽样中被抽取的概率,【例】假设总体有A、B、C、D、E五个单位,现纯随机不重复抽取2个单位组成样本
14、,求全部可能样本个数。,(N=5 n=2),第一次抽取:,第二次抽取:,则所有可能的样本个数为:,AB AC AD AE BA BC BD BECA CB CD CEDA DB DC DE EA EB EC ED,(抽后不放回),解:,9/24/2022,【例】假设总体有A、B、C、D、E五个单位,现纯随机不重复抽,(1)n次抽样中,总体每个单位在各次抽样中被抽取的概率不相同(第1次是1N,第2次是1N1,);,(2)可组成k=N(N1)(N 2)(N n+1)个样本,每个样本在各次抽样中被抽取的概率都相同(即均为1k)。,不重复抽样的特点:,9/24/2022,(1)n次抽样中,总体每个单位
15、在各次抽样中被抽取的概率不相同,可能的样本个数计算公式,9/24/2022,抽样方法重复抽样不重复抽样考虑顺序不考虑顺序可能的样本个数计,设计抽样方案,抽取样本单位,收集样本数据,计算样本统计量,推断总体,三、抽样调查的一般步骤,界定调查总体选择收集资料的方式选择抽样框确定抽样组织形式确定抽样方法确定样本单位数,抽取样本评估样本,9/24/2022,设计抽样方案抽取样本单位收集样本数据计算样本统计量推断总体三,.,.,随机原则,样本,n=100,总体,N=10000,推断,(抽样误差),(总体指标),(样本指标),M个样本,抽样实际误差,抽样平均误差,(可以计算),(无法计算),抽样极限误差,
16、概率度,置信度(概率),9/24/2022,.随机原则 样本n=100总体N=1000,.,第二节 抽样调查的数理基础,一、概率 二、随机变量及其分布 三、大数定律和中心极限定理 四、抽样分布,9/24/2022,.第二节 抽样调查的数理基础 一、概率9/24/,一、概率,(一)随机事件(二)事件的概率(三)概率的基本性质,9/24/2022,一、概率(一)随机事件9/24/2022,随机现象:在一定条件下可能发生也可能不发生的现象。如,“一分钟内从某十字路口通过30辆汽车”“抛一次硬币,正面朝上”。,随机试验:对随机现象进行观察的过程。,可在相同条件下重复进行;所有可能结果可知;事先不能肯定
17、哪一结果出现。,须满足三个条件:,与随机现象相对应的是确定性现象,是指在一定条件下,能够明确预见其结果的现象。,(一)随机事件,9/24/2022,随机现象:在一定条件下可能发生也可能不发生的现象。随机试,随机事件:随机试验的每一可能结果。,基本事件(样本点):不可能再分的事件;例如:掷一枚骰子出现的点数,有“1”、“2”“6”6个样本空间(基本空间):基本事件的全体()。一个试验中所有基本事件的集合,用表示例如:在掷枚骰子的试验中,1,2,3,4,5,6在投掷硬币的试验中,正面,反面,9/24/2022,随机事件:随机试验的每一可能结果。基本事件(样本点):不,复杂事件:由某些基本事件组合而
18、成的事件。必然事件:每次试验必然发生的事件()。,不可能事件:每次试验必然不会发生的事件()。,例如,在掷一枚骰子观察点数的试验中,“出现的点数不超过6”是必然事件;“出现8点”是不可能事件;“出现点数是奇数”是复杂事件,是由若干个基本事件组合而成的。,9/24/2022,复杂事件:由某些基本事件组合而成的事件。不可能事件:每,(二)事件的概率,概率(几率)是指随机事件发生的可能性。事件A的概率是对事件A在试验中出现的可能性大小的一种度量;表示事件A出现可能性大小的数值;事件A的概率表示为P(A);概率的定义有:古典定义、统计定义和主观概率定义,9/24/2022,(二)事件的概率概率(几率)
19、是指随机事件发生的可能性。事件A,古典定义:某一事件A发生的概率,是该事件所包含的基本事件数 m与基本空间中基本事件总数n 的比值。(客观存在),【例】投掷 2 枚骰子,求 2 枚骰子中至少有一枚出现 6 点,且点数之和为偶数的概率。,解:A有“(6,2),(6,4),(6,6),(2,6),(4,6)”5种;,9/24/2022,古典定义:【例】投掷 2 枚骰子,求 2 枚骰子中至少有一,【例】某钢铁公司所属三个工厂的职工人数如下表。从该公司中随机抽取1人,问:(1)该职工为男性的概率;(2)该职工为炼钢厂职工的概率。,9/24/2022,【例】某钢铁公司所属三个工厂的职工人数如下表。从该公
20、司中随机,解:(1)用A 表示“抽中的职工为男性”这一事件;A为全公司男职工的集合;基本空间为全公司职工的集合。则,(2)用B 表示“抽中的职工为炼钢厂职工”;B为炼钢厂 全体职工的集合;基本空间为全体职工的集合。则,9/24/2022,解:(2)用B 表示“抽中的职工为炼钢,统计定义:在相同条件下重复进行n次试验,事件A发生m次,随着试验次数n的增大,事件A发生的频率 m/n 围绕某一常数p上下波动的幅度愈来愈小,且逐步趋于稳定,则称p为事件A的概率。(多次试验),(5.2),如:,9/24/2022,统计定义:(5.2)如:9/24/2022,【例】投掷一枚硬币,出现正面和反面的频率,随着
21、投掷次数 n 的增大,出现正面和反面的频率稳定在1/2左右,9/24/2022,【例】投掷一枚硬币,出现正面和反面的频率,随着投掷次数 n,【例】某工厂为节约用电,规定每天的用电量指标为1000度。按照上个月的用电记录,30天中有12天的用电量超过规定指标,若第二个月仍没有具体的节电措施,试问该厂第一天用电量超过指标的概率。解:上个月30天的记录可以看作是重复进行了30次试验,试验A表示用电超过指标出现了12次。根据概率的统计定义有,9/24/2022,【例】某工厂为节约用电,规定每天的用电量指标为1000度。按,主观定义:人们根据经验和所掌握的有关信息,对事件发生的可能性大小给出的估计值。(
22、调查研究),例如,高考填志愿时,某考生估计自己被一本第一志愿录取的可能性为80%;如果一本落榜,被二本第一志愿录取的可能性为99%。,9/24/2022,主观定义:例如,高考填志愿时,某考生估计自己被一本第一志,(三)概率的基本性质,非负性对任意事件A,有 0 P 1规范性必然事件的概率为1;不可能事件的概率为0。即P()=1;P()=0可加性若A与B互斥,则P(AB)=P(A)+P(B)推广到多个两两互斥事件A1,A2,An,有 P(A1A2 An)=P(A1)+P(A2)+P(An),9/24/2022,(三)概率的基本性质非负性9/24/2022,(四)概率的加法法则(两个)法则1:两个
23、互斥事件之和的概率,等于两个事件概率之和。假设A和B是互斥事件,则:,法则2:对于任意两个随机事件,它们之和的概率等于两事件的概率之和减去两事件之交的概率。即:,9/24/2022,(四)概率的加法法则(两个)法则1:两个互斥事件之和的概,【例】设某地有甲、乙两种报纸,该地成年人中有20读甲报纸,16读乙报纸,8两种报纸都读,问成年人中有百分之几至少读一种报纸?解:设A读甲报纸,B读乙报纸,C至少读一种报纸,则:由题意知于是即有28的成年人至少读一种报纸。,9/24/2022,【例】设某地有甲、乙两种报纸,该地成年人中有20读甲报纸,,二、随机变量及其分布,(一)随机变量(二)离散型随机变量的
24、概率分布(三)连续型随机变量的概率分布(四)正态分布,9/24/2022,二、随机变量及其分布(一)随机变量9/24/2022,随机变量的概念:描述随机现象某一侧面的变量,是对一次试验的结果的数值性描述。一般用 X、Y、Z 来表示。,随机变量的特点:取值的随机性;取值的规律性。,3.随机变量的种类:根据取值情况的不同分 离散型随机变量 连续型随机变量,(一)随机变量,9/24/2022,随机变量的概念:描述随机现象某一侧面的变量,是对一次试验的,(1)离散型随机变量,概念:随机变量 X 取有限个值或所有取值都可以逐个列举出来 X1,X2,离散型随机变量的例子:,9/24/2022,(1)离散型
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样调查 12 课件
链接地址:https://www.31ppt.com/p-2109283.html