统计学第六章抽样推断.ppt
《统计学第六章抽样推断.ppt》由会员分享,可在线阅读,更多相关《统计学第六章抽样推断.ppt(155页珍藏版)》请在三一办公上搜索。
1、第六章 抽样推断,参数估计基本内容 假设检验科学的抽样估计方法应具备3个条件:1)要有合适的统计量作为估计量.2)要有合理的允许误差范围.3)要有一个可接受的置信度.,第六章 抽样推断,1.1 抽样方案的设计1.2 简单随机抽样的抽样误差的测定1.3 简单随机抽样的抽样估计,1.1 抽样方案的设计,一、抽样估计的意义和一般步骤二、抽样方案设计的基本准则,一、抽样估计的意义和一般步骤,抽样估计的定义 抽样估计的特点 抽样估计的运用 抽样估计的一般步骤 总体参数与样本指标,指样本单位的抽取不受主观因素及其他系统性因素的影响,每个总体单位都有均等的被抽中机会,抽样估计,第六章 抽样推断,按照随机原则
2、 从调查对象中抽取一部分单位进行调查,并以调查结果对总体数量特征作出具有一定可靠程度的估计与推断,从而认识总体的一种统计方法,统计推断,全及总体指标:参数(未知量),样本总体指标:统计量(已知量),抽样估计,第六章 抽样推断,并非所有的抽样估计都按随机原则抽取样本,也有非随机抽样,总体,随机样本,非随机样本,与总体分布特征相同,与总体分布特征不同,第六章 抽样推断,按随机原则抽取样本单位目的是推断总体的数量特征抽样推断的结果具有一定的可靠程度,抽样误差可以事先计算并控制,抽样估计的特点,第六章 抽样推断,不可能进行全面调查时不必要进行全面调查时来不及进行全面调查时对全面调查资料进行补充修正时,
3、抽样估计的应用,第六章 抽样推断,第六章 抽样推断,抽样调查研究Sampling Study,为什么要抽样?1.涉及破坏受试对象质量控制2.取得精确可靠的结果3.实际情况的约束时间,成本等,设计抽样方案,抽取样本单位,收集样本数据,计算样本统计量,推断总体参数,抽样估计的一般步骤,第六章 抽样推断,设总体中 个总体单位某项标志的标志值分别为,其中具有某种属性的有 个单位,不具有某种属性的有 个单位,则,总体平均数(又叫总体均值):,第六章 抽样推断,总体单位标志值的标准差:,总体单位标志值的方差:,第六章 抽样推断,总体成数:,总体是非标志的标准差:,总体是非标志的方差:,第六章 抽样推断,设
4、样本中 个样本单位某项标志的标志值分别为,其中具有和不具有某种属性的样本单位数目分别为 和 个,则,样本平均数(又叫样本均值):,第六章 抽样推断,样本单位标志值的标准差:,样本单位标志值的方差:,样本成数:,样本单位是非标志的标准差:,样本单位是非标志的方差:,第六章 抽样推断,1.1 抽样方案的设计,一、抽样估计的意义和一般步骤二、抽样方案设计的基本准则三、抽样方案设计的主要内容,随机原则,抽取样本单位时,应确保每个总体单位都有被抽取的可能;在对样本单位的资料进行搜集和整理时,不能随意遗漏或更换样本单位,抽样误差最小,在其他条件相同的情况下,选抽样误差最小的方案,费用最少,在其他条件相同的
5、情况下,选费用最少的方案,设计抽样方案时,通常是在误差达到一定要求的条件下,选择费用最少的方案,抽样方案设计的基本准则,第六章 抽样推断,1.1 抽样方案的设计,一、抽样估计的意义和一般步骤二、抽样方案设计的基本准则三、抽样方案设计的主要内容,编制抽样框 确定抽样方法 确定抽样组织方式 确定样本容量,三、抽样方案设计的主要内容,编制抽样框,第六章 抽样推断,区域抽样框,在商场的大门口,在微波炉柜台前,在市区街道旁边,在某个住宅小区,中山区沙河口区星海街道黑石礁街道尖山一委尖山二委居民一组居民二组,某外国公司在大连进行微波炉市场调查:,第六章 抽样推断,时间表抽样框,连续出产的产品总体可以编制抽
6、样框:均匀的出产时间、可以预见到的产品总量。,连续到加油站加油的汽车总体无法编制抽样框:时间不定、总量也无法确定。,第六章 抽样推断,确定抽样方法,重复抽样,又被称作重置抽样、有放回抽样,抽出个体,登记特征,放回总体,继续抽取,特点,同一总体单位有可能被重复抽中,而且每次抽取都是独立进行,第六章 抽样推断,不重复抽样,又被称作不重置抽样、不放回抽样,抽出个体,登记特征,继续抽取,特点,同一总体中每个单位被抽中的机会并不均等,在连续抽取时,每次抽取都不是独立进行,是最为常用的抽样方法,用于无限总体和许多有限总体样本单位的抽样。,确定抽样方法,第六章 抽样推断,确定抽样组织方式,是最简单、最基本、
7、最符合随机原则,但同时也是抽样误差最大的抽样组织形式,第六章 抽样推断,总体N,样本n,等额抽取,等比例抽取,能使样本结构更接近于总体结构,提高样本的代表性;能同时推断总体指标和各子总体的指标,确定抽样组织方式,第六章 抽样推断,随机起点,半距起点,对称起点,(总体单位按某一标志排序),按无关标志排队,其抽样效果相当于简单随机抽样;按有关标志排队,其抽样效果相当于类型抽样。,确定抽样组织方式,第六章 抽样推断,例:总体群数R=16 样本群数r=4,样本容量,简单、方便,能节省人力、物力、财力和时间,但其样本代表性可能较差,确定抽样组织方式,第六章 抽样推断,例:在某省100多万农户抽取1000
8、户调查农户生产性投资情况。,确定抽样组织方式,第六章 抽样推断,调查对象的性质特点对调查对象的了解程度(抽样框的特点)抽样误差的大小人力、财力和物力等条件的限制,在实际工作中,选择适当的抽样组织方式主要应考虑:,确定抽样组织方式,第六章 抽样推断,确定样本容量,n30,为大样本;n 30,为小样本,第六章 抽样推断,重复抽样的可能样本数目:,不重复抽样的可能样本数目:,确定样本容量,第六章 抽样推断,第六章 抽样推断,1.1 抽样方案的设计1.2 简单随机抽样的抽样误差的测定1.3 简单随机抽样的抽样估计,一、抽样分布二、抽样估计量的优良标准三、抽样误差的概念四、抽样平均误差五、抽样极限误差,
9、1.2 简单随机抽样的抽样误差的测定,主要样本统计量,平均数比率(成数)方差,第六章 抽样推断,例:某大公司人事部经理整理其2500个中层干部的档案。其中一项内容是考察这些中层干部的平均年薪及参加过公司培训计划的比例。总体:2500名中层干部,如果:上述情况可由每个人的个人档案中得知,可容易地测出这2500名中层干部的平均年薪及标准差。,假如:1:已经得到了如下的结果:总体均值:51800 总体标准差:=4000,上述总体均值、总体标准差、比例均称为总体的参数,2、同时,有1500人参加了公司培训,则参加公司培训计划的比例为:P=1500/2500=0.60,如:上例中的中层干部平均年薪,年薪
10、标准差及受培训人数所占比例均为该公司中层干部这一总体的参数。抽样估计就是要通过样本而非总体来估计总体参数。,如果抽样的样本与前一次的不同,则可得到另外的平均年薪样本均值、标准差以及受训干部的比例。如果多次抽样,则可得到多个不同的结果。下表是一个假设的经过500次抽样后的情况表。,下表给出了500个 的频数分布与相对频数分布,,图4.1 500个 的相对频数分布,这里,的相对频数分布,就称为 的抽样分布。,正是抽样分布及其特征使得用样本统计量估计总体参数的“精确程度”能够给予概率上的描述。,一般地,样本统计量的可能取值及其取值概率所形成的概率分布,统计上称为抽样分布(sampling distr
11、ibution)。,精确度,可靠度,平均数的抽样分布,全部可能样本平均数的均值等于总体均值,即:从非正态总体中抽取的样本平均数当n足够大时其分布接近正态分布。从正态总体中抽取的样本平均数不论容量大小其分布均为正态分布。样本均值的标准差为总体标准差的。,第六章 抽样推断,比率的抽样分布,全部可能样本比率的均值等于总体比率,即:从非正态总体中抽取的样本比率,当n足够大时其分布接近正态分布。从正态总体中抽取的样本比率,不论容量大小其分布均为正态分布。样本比率的标准差为总体标准差的。,第六章 抽样推断,样本比率的抽样分布是样本比率所有可能值的概率分布。,样本抽样分布,原总体分布,第六章 抽样推断,一、
12、抽样分布二、抽样估计量的优良标准三、抽样误差的概念四、抽样平均误差五、抽样极限误差,1.2 简单随机抽样的抽样误差的测定,抽样估计量的优良标准,设为待估计的总体参数,为样本统计量,则的优良标准为:,若,则称为的无偏估计量,第六章 抽样推断,若,则称为比更有效的估计量,若越大越小,则称为的一致估计量,抽样估计量的优良标准,第六章 抽样推断,抽样估计量的优良标准,第六章 抽样推断,一、抽样分布二、抽样估计量的优良标准三、抽样误差的概念四、抽样平均误差五、抽样极限误差,1.2 简单随机抽样的抽样误差的测定,第六章 抽样推断,第六章 抽样推断,影响因素,1、样本单位数。(越大,误差越小)2、总体内各单
13、位被研究标志的变异程度。(越大,误差越大)3、抽样方法。(不重复小于重复)4、抽样组织形式。(通常采用机械和类型抽样方式组织抽样调查),一、抽样分布二、抽样估计量的优良标准三、抽样误差的概念四、抽样平均误差五、抽样极限误差,1.2 简单随机抽样的抽样误差的测定,抽样平均误差,指每一个可能样本的估计值与总体指标值之间离差的平均数,即样本估计量的标准差,式中:为样本平均数的抽样平均误差;为可能的样本数目;为第 个可能样本的平均数;为总体平均数,注意:不要混淆抽样标准差与样本标准差!,第六章 抽样推断,例现有A、B、C、D四名工人构成的总体,他们的日产量分别为22、24、26、28件。从四名工人中任
14、取两名构成一个样本,请利用重复抽样和不重复抽样的方法计算抽样平均误差。,【分析】,先计算出三类数值:,根据抽样平均误差的计算公式,我们必须,本题要求我们计算抽样平均误差。,可能样本总数。,总体平均日产量、,样本平均日产量、,总体平均日产量,1、重复抽样。,样本数为,2、不重复抽样。,样本数为,但是,上面计算抽样平均误差的这个理论公式,在实际应用上会存在两个困难:,运用这个公式要求把所有的样本都抽选出来,然后计算它们的指标数值。这在实际应用过程中几乎是不可能的。,运用上面公式要求总体平均数的数值是已知的。但实际上,总体平均数的数值是未知的,它正是抽样调查要推断的。,抽样平均误差的计算公式,样本平
15、均数的抽样平均误差,当N500时,有,重复抽样时:,不重复抽样时:,第六章 抽样推断,如果总体单位数很“大”而样本容量很“小”,则该修正因子趋近于1,这时,对不重复抽样可直接按重复抽样的公式去计算。一个经验的衡量标准是n/N=0.05。,称为修正因子,样本成数的抽样平均误差,重复抽样时:,不重复抽样时:,当N500时,有,抽样平均误差的计算公式,第六章 抽样推断,影响抽样误差的因素,总体各单位的差异程度(即标准差的大小):越大,抽样误差越大;样本单位数的多少:越大,抽样误差越小;抽样方法:不重复抽样的抽样误差比重复抽样的抽样误差小;抽样组织方式:简单随机抽样的误差最大。,第六章 抽样推断,一、
16、抽样分布二、抽样估计量的优良标准三、抽样误差的概念四、抽样平均误差五、抽样极限误差,1.2 简单随机抽样的抽样误差的测定,68.27%,95.45%,99.73%,抽样极限误差,第六章 抽样推断,抽样极限误差,指在一定的概率保证程度下,抽样误差不允许超过的某一给定范围,也称作允许误差、误差范围、误差置信限等,由于提高把握程度,会增大允许误差,使估计精度降低,而缩小允许误差,提高估计的精度,又会降低估计的把握程度,所以在实际中应根据具体情况,先确定一个合理的把握程度再求相应的允许误差或先确定一个允许误差范围再求相应的把握程度。,第六章 抽样推断,抽样极限误差的计算公式,(大样本条件下),Z为概率
17、度,是给定概率保证程度下样本均值偏离总体均值的抽样平均误差的倍数。,第六章 抽样推断,Z与相应的概率保证程度存在一一对应关系,常用Z值及相应的概率保证程度为:,z值 概率保证程度1.00 0.6827 1.65 0.9000 1.96 0.9500 2.00 0.9545 2.58 0.9900 3.00 0.9973,抽样极限误差的计算公式,(大样本条件下),第六章 抽样推断,标准正态分布函数值表,注意:1、统计学上往往用抽样极限误差来测度抽样误差的大小或者说测度点估计的精度。原因:总体参数值往往并不知道,因此,实际抽样误差与抽样平均误差也往往无法求出,但在抽样分布大体知道的情况下,抽样极限
18、误差是可以估计出来的。,一定概率下抽样误差的可能范围(也称允许误差):,2、抽样极限误差的估计总是要和一定的概率保证程度联系在一起的。,原因:样本统计量往往是一随机变量,它与总体参数真值之差也是一个随机变量,因此就不能期望某次抽样的样本估计值落在一定区间内是一个必然事件,而只能给予一定的概率保证。因此,在进行抽样估计时,既需要考虑抽样误差的可能范围,同时还需考虑落到这一范围的概率大小。前者是估计的准确度问题,后者是估计的可靠性问题,两者紧密联系不可分开。这也正是区间估计所关心的主要问题。,第六章 抽样推断,1.1 抽样方案的设计1.2 简单随机抽样的抽样误差的测定1.3 简单随机抽样的抽样估计
19、,一、点估计二、区间估计三、样本数目的确定,1.3 简单随机抽样的抽样估计,第六章 抽样推断,用样本统计量(sample statistics)可以作为其对应的总体的点估计量(point estimator)。但要估计总体的某一指标,并非只能用一个样本指标,而可能有多个指标可供选择,即对同一总体参数,可能会有不同的估计量。,点估计量的性质:估计量优劣的衡量,作为一个好的点估计量,统计量必须具有如下性质:无偏性、有效性、一致性,在上例中,假如随机抽取了一个容量为30的样本:年薪 是否参加过培训计划 49094.3 Yes 53263.9 Yes 49643.5 Yes,点估计(Point Est
20、imation),假如根据该样本求得的年薪样本平均数、标准差及参加过培训计划人数的比例分别为:,则可用上述结果分别代表2500名中层干部的平均年薪、年薪的标准差及受训比例。,上述估计总体参数的过程被称为点估计(point estimation);样本均值(标准差/比例)称为总体均值(标准差/比例)的点估计量(point estimator);样本均值(标准差/比例)的具体数值称为总体均值(标准差/比例)的点估计值(point estimate)。由于点估计量是由样本测算的,因此也称为样本统计量。,一、点估计二、区间估计三、样本数目的确定,1.3 简单随机抽样的抽样估计,二、区间估计,区间估计的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 第六 抽样 推断
链接地址:https://www.31ppt.com/p-6193919.html