《抽样及抽样分布.ppt》由会员分享,可在线阅读,更多相关《抽样及抽样分布.ppt(43页珍藏版)》请在三一办公上搜索。
1、1,第八章 抽样及抽样分布,2,学习目标,抽样推断抽样调查的组织方式和抽样方法抽样误差抽样估计样本容量的确定,3,第一节 抽样推断概述,抽样调查按照随机性原则,从全部研究对象中抽取一部分单位进行观察的一种非全面性调查抽样推断在抽样调查的基础上,依据所获得的数据对全部研究对象的数量特征作出具有一定可靠性的估计和判断,从而达到对研究整体认识的一种统计分析方法,4,抽样推断的特点,目的是由部分来估计和判断整体抽样推断是建立在随机抽样的基础之上的运用概率估计的方法,其误差不仅可以事先计算,而且可以控制,5,抽样推断的作用,在无法进行全面调查或进行全面调查有困难的时候,可以运用抽样调查来推断总体采用抽样
2、调查,可以节省费用和时间,提高调查的时效性和经济效果可以用来对全面资料做检验和修正可以用于工业生产过程的质量控制可以对某种总体的假设进行检验,来判断这种假设是否正确以决定行动的取舍,6,几个基本的概念,总体中国计量学院所有学生的身高总体,杭州所有居民的收入总体,金融资产收益总体样本从中国计量学院随机抽取的200个学生的身高随机抽取的1000个杭州居民的收入观察到的金融资产的收益,7,总体指标和样本指标,8,样本容量和样本个数,样本容量一个样本中所包含的单位数n样本个数从总体中可能抽取或可能构成的样本的数目,9,第二节 抽样中常用的分布及定理,10,第二节 抽样调查的组织方式和方法,11,12,
3、13,14,15,16,抽样方法和样本可能数目,考虑顺序的不重复抽样数目考虑顺序的重复抽样数目不考虑顺序的不重复抽样数目不考虑顺序的重复抽样数目,17,统计学的分析思路,总体population,样本sample,sampling,inferring,18,变 异,“世界上没有两片完全相同的叶子”-植物学家“世界的丰富多彩来源于其多样性”-哲学家“个体差异是生物医学领域里普遍存在的现象”-医学家统计学就是研究变异(variation)的科学。,19,抽样误差,变 异-抽样误差(variation)-(sampling error),联系?,20,抽样实验,例1:假定某地正常成年男子的红细胞计数
4、服从正态分布N(5.00,0.502)的总体,单位1012/L。用计算机模拟从该总体中随机抽样,每次抽10例组成一个样本,重复100次抽样。结果见表1。,21,抽样实验,22,抽样实验,23,抽样误差,由于事物间普遍存在着变异,由此产生了这么一个现象:由于抽样而引起的误差 抽样误差,24,抽样误差,定义:抽样误差(sampling error):是指由于样本的随机性引起的统计量与参数的差别,或同一总体的相同统计量之间的差别。,25,了解抽样误差规律的重要性,总体同质个体、个体变异,总体参数未知,样本代表性、抽样误差,随机抽样,样本统计量已知,统计推断,风 险,26,均值的模拟试验,考察:样本均
5、值的均值与总体均值有何关系?样本均值的标准差与总体标准差有何关系?样本均值的分布形状如何?不同的样本含量对上述性质的影响如何?,27,正态分布样本均值的分布,从N(100,62)中随机抽样,样本含量为4的 10份独立样本的均值、标准差、抽样误差,28,样本均值的均值和标准差,29,从N(100,62)中随机抽样,样本含量为4的1000个样本均值的频数分布图,正态总体分布,样本均值服从正态分布,30,n=10,n=4,n=25,n=2,Sampling Distributionof sample means,Sampling distribution for means,31,均值的抽样误差之特
6、点,各样本均值未必等于总体均值;样本均值间存在差异;样本均值的分布很有规律,围绕总体均值,中间多两边少,左右基本对称;样本均值的变异范围较之原变量的变异范围大大缩小;随着样本含量的增加,样本均值的变异范围逐渐缩小。,32,抽样误差,在实际工作中,由于各种条件所限,一般不可能也没有必要观察总体中的每一个个体,常常是通过抽样来进行研究的。虽然抽样误差是不可避免的,但其大小是可以度量的。问题:如何度量抽样误差的大小?,33,标准误(Standard Error,SE)统计学上将样本均数X、样本率P等统计量的标准差称为标准误,它可用于说明抽样误差的大小。,抽样误差,34,标准误(standard er
7、ror),样本统计量的标准差称为标准误。样本均值的标准差称为均值的标准误。均值的标准误表示样本均值的变异度。当总体标准差未知时,用样本标准差代替,前者称为理论标准误,后者称为样本标准误。,35,抽样误差的计算,样本平均值的标准误差在重复抽样下在不重复抽样下,36,样本成数的的标准误差在重复抽样下在不重复抽样下,37,综合练习 1 某电子元件厂对10000个元件使用寿命抽取1%进行检验,结果如表所示。,38,表1 1%样品测试数据 1.样本平均数=105550/100=1055.5(小时),39,将表1整理为表2表2 1%样品标准差计算表,40,重复抽样:不重复抽样:2.质量标准规定使用寿命不足1000小时为不合格品,试分别计算不同抽样方法条件下该厂元件成数(合格率)与抽样误差。如表3所示。,41,表3 成数抽样误差计算表,42,重复抽样:不重复抽样:,43,影响抽样误差的因素 抽样理论研究和实践证明影响抽样误差大小的因素主要有:(一)总体各变量值X 间差异的大小 如果其他条件不变,离散程度(X或P)越大,抽样误差x或p越大;反之,则越小。(二)样本单位数(样本容量)的多少 其他条件不变,样本单位数n 越少,抽样误差越大;反之,则越小。(三)抽样方法 重复抽样误差大于不重复抽样误差。(四)抽样调查组织形式 不同的抽样组织形式会产生不同的抽样误差。,
链接地址:https://www.31ppt.com/p-5056493.html