《统计学》样本容量的确定.ppt
5.7 样本容量的确定,样本容量确定的两难,样本容量取得较大,收集的信息就相对多,从而估计精度较高,但进行观测所投入的费用、人力及时间就比较多;样本容量取得较小,则投入的费用、人力及时间就相对节约,但收集的信息也较少,从而估计精度较低;所以,精度和费用对样本量的影响和要求是矛盾的,不存在既使精度最高又使费用最省的样本量。,样本容量确定的准则,在对精度有要求时,寻求能够保证精度要求的费用最省的样本量;由于费用通常是关于样本量的正向线性函数,故使费用最省的样本量也就是使精度得到保证的最小样本量;在费用有预算限制的时候,寻求费用预算范围内使精度达到最高的样本量。,估计总体均值时样本容量的确定,估计总体均值时样本容量n为:重复抽样 不重复抽样,估计总体均值时样本容量的确定,其中:,样本容量n与总体方差成正比,与绝对误差成反比,与概率度成正比。,估计总体均值时样本容量的确定(例题分析),【例】拥有工商管理学士学位的大学毕业生年薪的标准差大约为2000元,假定想要估计年薪95%的置信区间,希望允许误差为400元,应抽取多大的样本容量?,估计总体均值时样本容量的确定(例题分析),解:已知=2000,d=400,1-=95%,z/2=1.96 置信度为95%的置信区间为:,即应抽取97人作为样本。,估计总体比例时样本容量的确定,根据比例区间估计公式可得样本容量n为:重复抽样 不重复抽样,估计总体比例时样本容量的确定,d的取值一般小于0.1未知,以样本比例p替代或p都未知时,可取0.5,这是一种谨慎估计,其中:,估计总体比例时样本容量的确定(例题分析),【例】根据以往的生产统计,某种产品的合格率约为90%,现要求允许误差为5%,在求95%的置信区间时,应抽取多少个产品作为样本?,解:已知p=90%,1-=95%,Z/2=1.96,d=5%,应抽取的样本容量为:,应抽取139个产品作为样本。,本节结束,谢谢!,