《抽样与抽样估计》PPT课件.ppt
《《抽样与抽样估计》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《抽样与抽样估计》PPT课件.ppt(45页珍藏版)》请在三一办公上搜索。
1、第四章 抽样估计,什么是抽样估计抽样估计的基本概念与点估计抽样误差与区间估计,什么是抽样估计?,The purpose of Statistics inference is to obtain information about a population from information contained in sample.例1 一汽车轮胎制造商生产一种被认为寿命更长的新型轮胎。,120个样本,测试,平均里程:36,500公里,推断,新轮胎平均寿命:36,500公里,400个样本,支持人数:160,推断,支持该候选人的选民占全部选民的比例:160/400=40%,例2:某党派想支持某一候选
2、人参选美国某州议员,为了决定是否支持该候选人,该党派领导需要估计支持该候选人的民众占全部登记投票人总数的比例。由于时间及财力的限制:,抽样估计方法主要用在下列两种情况:,注意:抽样估计只得到对总体特征的近似测度,因此,抽样估计还必须同时考察所得结果的“可能范围”与“可靠程度”。,1、对所考查的总体不可能进行全部测度;2、从理论上说可以对所考查的总体进行全部测度,但实践上由于人力、财力、时间等方面的原因,无法(不划算)进行全部测度。,第一节 抽样推断的基本概念与点估计,例3:某大公司人事部经理整理其2500个中层干部的档案。其中一项内容是考察这些中层干部的平均年薪及参加过公司培训计划的比例。总体
3、:2500名中层干部(population),如果:上述情况可由每个人的个人档案中得知,可容易地测出这2500名中层干部的平均年薪及标准差。,假如:1:已经得到了如下的结果:总体均值(population mean):=51800 总体标准差(Population standard deviation):=4000,参数是总体的数值特征 A parameter is a numerical characteristic of a population。,上述总体均值、总体标准差、比例均称为总体的参数,2、同时,有1500人参加了公司培训,则参加公司培训计划的比例为:P=1500/2500=0.
4、60,如:例3中的中层干部平均年薪,年薪标准差及受培训人数所占比例均为该公司中层干部这一总体的参数。抽样估计就是要通过样本而非总体来估计总体参数。,一、简单随机抽样(Simple Random Sampling),注意:在有限总体的简单随机抽样中,由抽样是否具有可重复性,又可分为重复抽样与不重复抽样。而且,根据抽样中是否排序,所能抽到的样本个数往往不同。,简单随机抽样可根据总体的有限性或无限性分为有限总体随机抽样与无限总体随机抽样。,无限总体简单随机抽样:1、每一个体来自同一总体;2、每一个体是独立抽取的。,有限总体简单随机抽样:每个样本点(个体)能以相同的概率被抽出。,1、考虑顺序的不重复抽
5、样:N(N-1)(N-2)(N-n+1)2、考虑顺序的重复抽样:Nn,在总体单位数为N的总体中抽取容量为n的样本,样本个数可能有:,在社会经济统计中,往往采用的是较大总体(视为无限总体)下的无序不重复抽样。,3、不考虑顺序的不重复抽样:,4、不考虑顺序的重复抽样:,在例3中,假如随机抽取了一个容量为30的样本:Annual Salary Management Training Program?49094.3 Yes 53263.9 Yes 49643.5 Yes,二、点估计(Point Estimation),假如根据该样本求得的年薪样本平均数、标准差及参加过培训计划人数的比例分别为:,则可用
6、上述结果分别代表2500名中层干部的平均年薪、年薪的标准差及受训比例。,上述估计总体参数的过程被称为点估计(point estimation);样本均值(标准差/比例)称为总体均值(标准差/比例)的点估计量(point estimator);样本均值(标准差/比例)的具体数值称为总体均值(标准差/比例)的点估计值(point estimate)。由于点估计量是由样本测算的,因此也称为样本统计量。,在上述某公司30个中层干部的简单随机抽样中,如果再一次抽样的样本与前一次的不同,则可得到另外的平均年薪样本均值、标准差以及受训干部的比例。同样地,如果多次抽样,则可得到多个不同的结果。表4.1是一个假
7、设的经过500次抽样后的情况表。,三、抽样分布,表4.2给出了500个 的频数分布与相对频数分布,,图4.1 500个 的相对频数分布,这里,的相对频数分布,就称为 的抽样分布。,正是抽样分布及其特征使得用样本统计量估计总体参数的“精确程度”能够给予概率上的描述。,一般地,样本统计量的可能取值及其取值概率所形成的概率分布,统计上称为抽样分布(sampling distribution)。,精确度,可靠度,(一)样本平均数的抽样分布(Sampling Distribution of),考察样本均值的概率分布形式。分两种况:1)总体分布已知且为正态分布;2)总体分布未知;,1、样本均值抽样分布的形
8、状,(1)当总体分布已知且为正态分布或接近正态分布时,则无论样本容量大小如何,样本均值都为正态分布。,(2)当总体分布未知时,需要用到中心极限定理(Central limit Theorem),对容量为n 的简单随机样本,样本均值的分布随样本容量的增大而趋于正态分布。,经验上验证,当样本容量等于或大于30时,无论总体的分布如何,样本均值的分布则非常接近正态分布。因此统计上常称容量在30(含30)以上的样本为大样本(large-sample-size)。,例3中,中层干部年薪的总体均值为51800,因此所有可能的样本平均数的均值也为51800。,可证明在简单随机抽样中,2、样本均值抽样分布的数值
9、特征,n=样本容量;N=总体单位个数可以证明样本均值的标准差:,如果总体单位数很“大”而样本容量很“小”,则该修正因子趋近于1,这时,对有限总体可直接按无限总体的公式去计算。一个经验的衡量标准是n/N=0.05。,有限总体:,无限总体:,称为有限总体修正因子(finite population correction factor)。,样本容量与总体单位数的比值为 n/N=30/2500=0.012,,样本均值的标准差可用来测度样本均值与总体均值的“距离”,即可用来计算可能的误差,它也被称为均值标准误(standard error of the mean)。,例3中:,因此,样本均值的标准差可计
10、算如下:,样本统计量的估计值与其所要测度的总体参数值之间的绝对差距,被称为抽样误差(sampling error)。抽样分布能够用来提供抽样误差大小的可能性(概率)。,3、样本均值抽样分布的实际应用,在例3中,如果人事部经理认为在一次抽样中所得到的中层干部的平均年薪与总体均值(51800$)误差在500元以内,他就可以接受样本估计值。则问题归结为在一次抽样中,误差在500元以内的可能性(概率)有多大?,由于样本容量为30,可认为样本均值服从正态分布,因此,上述问题即为求一次抽样的样本均值点落在区间51300,52300内的概率,即求下图中阴影部分的面积。,该例中:52300对应的标准正态分布中
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样与抽样估计 抽样 估计 PPT 课件
链接地址:https://www.31ppt.com/p-5007298.html