统计学—抽样推断.ppt
《统计学—抽样推断.ppt》由会员分享,可在线阅读,更多相关《统计学—抽样推断.ppt(76页珍藏版)》请在三一办公上搜索。
1、1,第六章 抽样推断,STAT,本章重点提示:1、抽样推断的一般问题;2、抽样平均误差的概念及其计算;3、总体参数的区间估计;4、样本容量的确定;本章难点提示:1、抽样平均误差的概念及其计算;2、总体参数的区间估计,2,第六章 抽样推断,STAT,第一节 抽样推断的一般问题 抽样推断过程包括三个方面:随机抽样、参数估计、假设检验。一、抽样推断的概念 按随机原则,从总体中抽取一部分单位组成样本进行调查,并根据样本指标,对相应的总体指标作出具有一定可靠程度的估计和判断。随机原则:又称同等可能性原则,即机会面前、人人平等。作用:防止人的主观思想和利益关系的干扰。从总体中抽取样本的方法有概率抽样与非概
2、率抽样两种:概率抽样也叫随机抽样,是按随机原则抽取样本。概率抽样可避免系统性误差、可计算和控制抽样误差、可说明估计结果的可靠程度。,3,第六章 抽样推断,STAT,非概率抽样也叫非随机抽样,是根据经验或判断从总体中选取若干单位构成样本。如重点调查、典型调查、配额抽样、方便抽样等。非概率抽样难免掺杂调查者的主观偏见,存在系统性误差、不可以计算和控制抽样误差、不可以说明估计结果的可靠程度。统计上讲的抽样一般都是指概率抽样。二、抽样推断的特点1、是非全面调查 与普查的区别;2、按随机原则抽取样本 与典型调查和重点调查的区别;3、根据样本指标推断总体指标 与重点调查的区别;4、抽样误差可以事先计算与控
3、制 与典型调查的区别。,4,第六章 抽样推断,STAT,三、抽样推断的作用1、对某些社会现象不可能或不必要进行全面调查,但又必须了解其全面情况时,可采用抽样推断。(如:破坏性检验、无限总体、家计调查等等);2、与全面调查比较,省时、省力、省费用、时效性高;3、可用抽样推断资料对全面调查资料加以补充或修正;4、可用于工业生产过程中的质量控制。四、抽样推断中的基本概念(一)总体与样本:1、总体(全及总体):被观察对象的全体。N:总体单位数。2、样本(样本总体):按随机原则从总体中抽取的部分单位所构成的整体。n:样本单位数、样本容量,5,全及总体是唯一确定的,样本总体不是唯一确定的。(二)抽样框 将
4、全及总体中的每个单位进行编号而制定的目录或表格就是抽样框。一个理想的抽样框应与目标总体一致,不重复、不遗漏。编制抽样框的目的:1、便于抽取样本;2、保证随机原则得以实现。(三)抽样方法 1、重复抽样(回置抽样、放回抽样)特点:同一单位有多次被抽中的机会,每个单位中选的机会在每次都一样。2、不重复抽样(不回置抽样、不放回抽样)特点:同一单位只有一次被抽中的机会,每个单位中选的机会在各次都不相同。不重复抽样抽取的样本代表性高,6,第六章 抽样推断,STAT,(四)总体指标与样本指标总体指标(总体参数)样本指标(样本统计量)总体指标是确定性变量,样本指标是随机变量。,7,第六章 抽样推断,STAT,
5、五、抽样推断的组织形式(一)简单(纯)随机抽样 对总体不经过任何分组和排队,按照随机原则抽取样本单位。,特点:1、最符合随机原则,不含任何主观影响;2、当总体单位标志值变异较大时,抽样误差较大;3、编号在某些情况下难度较大。4、是其他抽样组织形式及抽样推断的基础。,8,第六章 抽样推断,STAT,(二)等距(机械)抽样 1、概念:事先将总体全部单位按某一标志排队,再按照相同的间隔抽取样本单位。总体N、样本 n 抽样间隔K=N/n。第一个样本单位用简单随机抽样方法确定。例N=50 n=5,则 K=50/5=10;若用抽签法确定第一组的4号为样本单位则 A4、A14、A24、A34、A44 2、排
6、队方式(1)按无关标志排队:排队的标志与调查研究的标志无关。(2)按有关标志排队:排队的标志与调查研究的标志有关。3、特点:容易组织、按有关标志排队的等距抽样代表性较高。,9,第六章 抽样推断,STAT,(三)分层(类型)抽样 1、概念 先将全部总体单位按主要标志进行分组(类),再按随机原则在各组进行纯随机抽样。2、抽样数目在各组的确定(1)类型平均抽样 适用前提是各组单位数相等或差异不大的情况下。(2)不等比例抽样:i/=ni/n 离差越大,抽得越多,反之亦反。,(但 事先不知道),10,第六章 抽样推断,STAT,*(2)等比例抽样:先将全部总体单位分类,再按同一比例在各类抽取样本单位。即
7、:n1/N1=n2/N2=n/N 样本与总体比例一致。例:,11,特点:*由于各类型组内标志差异程度缩小,类型抽样抽取的样本代表性高,抽样误差小。特别是总体各单位标志值大小悬殊时,类型抽样更具有优越性。(四)整群抽样 1、概念 先按某种标志或要求将总体区分为若干群(R),群内单位数(M)相等;再采取不重复抽样方式从R群随机抽出r群,尔后对样本群进行全面调查以推断总体。整群抽样和分层抽样都是统计分组和简单随机抽样结合的产物。但它们还是有本质区别的。其一,分群(层)原则不同。对于分层抽样,层间差异应尽可能大,层内差异应尽可能小;而对于整群抽样则相反。其二,抽样单位不同。分层抽样的抽样单位是基本单位
8、(即总体单位),而整群抽样的抽样单位是群。其三,调查方式不同。对于分层抽样,在层内是抽样调查,在层间是全面调查;而对于整群抽样则相反。2、特点 组织方便、省时省费用;但样本分布不均匀,代表性稍差。,12,第六章 抽样推断,STAT,六、抽样推断的理论基础(一)大数定理和中心极限定理 1、大数定理 在大量观察和多次试验的情况下,随机现象的偶然离差趋向于互相抵消,总体呈现出稳定的统计规律性。大数定理说明随机变量随着样本容量n的不断增大,样本平均数(或成数)愈来愈接近总体平均数(或成数)。2、中心极限定理 表明,在样本容量n充分大的条件下,不论总体的变量是否服从正态分布,其样本平均数 趋向于以总体平
9、均数为,方差为/n 的正态分布N(,/n)。(二)抽样分布 1、样本平均数的分布(见中心极限定理)2、样本成数的分布:当n 大n 和 n(1-)同时大于5时,样本成数近似服从于以总体成数为P,方差为P(1-P)/n的正态分布。,13,第六章 抽样推断,STAT,第二节、抽样误差的计算一、抽样误差的概念 登记性误差调查误差 系统性误差 代表性误差 实际抽样误差 抽样误差 抽样平均误差 代表性误差是指 由于样本的结构不能完全代表总体的结构所引起的误差。系统性误差是指由于抽样调查违反随机原则引起的误差;抽样误差是指由于抽样的随机性而产生的样本指标与总体指标的绝对离差。,14,第六章 抽样推断,STA
10、T,实际抽样误差:指某一次抽样结果所得的样本指标与总体指标之间的误差(不存在),实际抽样误差是随机变量;抽样平均误差:指所有可能的样本指标与总体指标之间的平均误差。用所有可能出现的样本指标的标准差表示(简称抽样误差),抽样平均误差是确定性变量。二、抽样平均误差概念举例 例:一个4人的全及总体,日产量为:甲40件,乙50件,丙70件,丁80件,假定从中抽取2人进行调查,求抽样平均误差。解:采用不重复抽样,考虑顺序,可组成样本个数为:,15,第六章 抽样推断,STAT,采用不重复抽样,不考虑顺序,可组成样本个数为:,现采用不重复抽样,不考虑顺序,则可抽取到6个的样本。,采用重复抽样,考虑顺序,可组
11、成样本个数为:,采用重复抽样,不考虑顺序,可组成样本个数为:,16,不重复抽样抽样平均误差计算表,(为全及总体平均数,M为可能组成的样本个数,为抽样平均误差,17,三、抽样平均误差的实际计算 概率论研究证明,所有可能出现的样本平均数的标准差与总体平均数的标准差之间的关系为:则:,(此公式为定义公式,不能据此公式计算抽样平均误差),即:6个样本平均数与总体平均数的平均离差为9.13件,不管抽到哪个样本,平均来说,误差是9.13件。,注:因总体方差不知,可A、用历史资料替代,若有若干个,取最大值;B、用样本方差替代。(样本的方差可不断地接近于总体的方差),18,第六章 抽样推断,STAT,(一)纯
12、随机抽样形式下 1、抽样平均数抽样平均误差的计算 重复抽样:不重复抽样:,*由于校正因子总是1,所以不重复抽样的抽样平均误差总比重复抽样的抽样平均误差小。在N很大时,校正因子趋近于1,因此,按不重复抽样方法抽取样本,也可按重复抽样的公式计算抽样平均误差。,19,第六章 抽样推断,STAT,例:某工厂生产一种灯泡共2000只,随机抽取400只作耐用时间实验,测试结果为平均寿命为4800小时,样本标准差为300小时,求抽样平均误差。重复抽样:不重复抽样:,20,第六章 抽样推断,STAT,2、抽样成数抽样平均误差的计算 重复抽样:不重复抽样:,注:(1)可用样本成数方差代替总体成数方差;(2)可用
13、样本成数 代替总体成数P;(3)有若干个P值时,取最接近0.5的P值;(4)无P值时,取P=0.5(此时方差最大),21,第六章 抽样推断,STAT,例:一批食品罐头60,000桶,随机抽查300桶,发现有6桶不合格,求合格率的抽样平均误差。解:已知样本的合格率=重复抽样:不重复抽样:,22,第六章 抽样推断,STAT,方差的加法定理:总方差=组间方差+平均组内方差*所以:类型比例(等比例)抽样抽样误差的计算是将各类型组的平均组内方差代替纯随机抽样误差计算公式中的总体方差。抽样平均数平均组内方差:,(二)分层(类型)抽样形式下,23,第六章 抽样推断,STAT,抽样成数平均组内方差=1、抽样平
14、均数抽样平均误差的计算 重复抽样:不重复抽样:2、抽样成数抽样平均误差的计算重复抽样:,24,第六章 抽样推断,STAT,例:某乡农户月平均收入抽样调查资料如下:,不重复抽样,试计算该乡农户月平均收入的抽样平均误差。,25,第六章 抽样推断,STAT,接上例,设每户月收入400元及以上的高收入户为P,不足400元的为低收入户,试计算抽样成数的抽样平均误差。,26,第六章 抽样推断,STAT,类型比例抽样抽样成数抽样平均误差计算表,27,第六章 抽样推断,STAT,各组抽样成数的平均数:平均组内方差:重复抽样:不重复抽样:,28,第六章 抽样推断,STAT,(三)机械(等距)抽样形式下 1、按无
15、关标志排队等距抽样的抽样平均误差按纯随机不重复抽样的抽样平均误差公式计算;2、按有关标志排队等距抽样的抽样平均误差,从理论上来讲,应采用类型抽样的误差公式计算,但因为每组只抽取一个样本单位,无法计算组内方差,实际工作中还是按纯随机不重复抽样的抽样平均误差公式计算。(四)整群抽样形式下,29,第六章 抽样推断,STAT,方差的加法定理:总方差=组间方差+平均组内方差*所以,整群抽样抽样平均误差的计算是将群间方差代替纯随机抽样抽样平均误差计算公式中的总方差即可。抽样平均数的群间方差:抽样成数的群间方差:1、抽样平均数抽样平均误差的计算(一般为不重复抽样),30,第六章 抽样推断,STAT,2、抽样
16、成数抽样平均误差的计算例:某农场播种某农作物3000亩,作物分布在60块地段上,每块地段50亩。现抽取5块地,全面调查农作物的收获情况和受灾损失,得到资料如下表:,31,第六章 抽样推断,STAT,解:据题意,R=3000/50=60 r=5,32,33,第六章 抽样推断,STAT,四、影响抽样抽样平均误差的因素 1、总体标志变动度的大小总体标志变动度大,大;总体标志变动度小,小。2、样本单位数的多少样本单位数多,小;样本单位数少,大。3、抽样方法及抽样的组织形式 不重复抽样及类型抽样、按有关标志排队的等距抽样的抽样平均误差相对要小。,34,第六章 抽样推断,STAT,第三节 总体 参数的估计
17、一、估计量与估计值1、待估参数:待估的总体参数(指标),用表示。2、估计量:作为估计依据的样本统计量(指标),用 表示。3、估计值:估计量的具体取值。例:二、估计量的优良标准 1、无偏性 如果一个随机变量的数学期望值等于被估参数的真值,即 则 数理统计证明,样本平均数和样本成数、样本中位数是无偏估计量,样本方差不是无偏估计量,即,35,第六章 抽样推断,STAT,2、一致性 当样本容量不断增大时,样本指标可以不断趋近于总体指标。根据中心极限定理,样本平均数是总体平均数的一致估计量;样本方差是总体方差的一致估计量。3、有效性 要求估计量的离散程度要小。,三、点估计 点估计就是直接用样本指标代表总
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 抽样 推断
链接地址:https://www.31ppt.com/p-4104589.html