欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    抽样分布和估计.ppt

    • 资源ID:6118621       资源大小:1.18MB        全文页数:98页
    • 资源格式: PPT        下载积分:15金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要15金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    抽样分布和估计.ppt

    第 3章 抽样分布和估计,3.1 常用的抽样方法 3.2 抽样分布(一)(一个总体参数推断时样本统计量的抽样分布)3.3 抽样分布(二)(两个总体参数推断时样本统计量的抽样分布)3.4 中心极限定理的应用3.5 参数估计,学习目标,了解抽样的概率抽样方法理解抽样分布的意义了解抽样分布的形成过程理解中心极限定理理解抽样分布的性质掌握抽样估计方法,3.1 常用的抽样方法,一、简单随机抽样二、分层抽样三、系统抽样四、整群抽样,抽样方法,一、简单随机抽样(simple random sampling),从总体N个单位中随机地抽取n个单位作为样本,使得总体中每一个元素都有相同的机会(概率)被抽中 抽取元素的具体方法有重复抽样和不重复抽样特点简单、直观,在抽样框完整时,可直接从中抽取样本用样本统计量对目标量进行估计比较方便局限性当N很大时,不易构造抽样框抽出的单位很分散,给实施调查增加了困难没有利用其他辅助信息以提高估计的效率,二、分层抽样(stratified sampling),将总体单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本优点保证样本的结构与总体的结构比较相近,从而提高估计的精度组织实施调查方便既可以对总体参数进行估计,也可以对各层的目标量进行估计,三、系统抽样(systematic sampling),将总体中的各单位按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位先从数字1到k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k等单位优点:操作简便,可提高估计的精度,四、整群抽样(cluster sampling),先将总体划分为若干个群,然后再以群作为调查单位从中抽取部分群,然后对中选群中的所有单位全部实施调查。特点抽样时只需群的抽样框,可简化工作量调查的地点相对集中,节省调查费用,方便调查的实施当群为总体的一个缩影时,抽样估计误差小,否则误差较大。,非概率抽样方法(一)方便抽样方便抽样(Convenient Sampling)又称偶遇抽样,是根据调查者的方便与否来抽取样本的一种抽样方法。通常,回答者之所以被选中,只是因为他们当时碰巧在调研现场。由于对调查条件要求较低,在操作时的难度更小。最大的问题在于受访者的选择是随意的,很容易发生偏差。,(二)判断抽样判断抽样(Judgment Sampling)又称目的抽样,它是凭研究人员的主观意愿、经验和知识,从总体中选择具有典型代表性的样本作为调查对象的一种抽样方法。选取样本单位方法:1.选择最能代表普遍情况的调查对象。2.利用调查总体的全面统计资料。广泛应用于商业领域的市场调研中,特别是在样本量小及样本不易分门别类挑选时有较大优越性。,(三)配额抽样 配额抽样(Quota Sampling)类似随机抽样中的分层抽样,它也是首先将总体中的所有单位按一定的标志分为苦干类(组),然后在每个类(组)中用方便抽样或判断抽样的方法选取样本单位。分类:1.独立控制配额抽样。2.交叉控制配额抽样。,(四)滚雪球抽样滚雪球抽样(Snowball Sampling)是一种在稀疏总体中寻找受访者的抽样方法。滚雪球抽样的主要目的:估计在总体中十分稀有的人物特征。优点:便于有针对性地找到被调查者。局限性:要求样本单位之间必须有一定的联系,并且愿意保持和提供这种关系。,3.2 抽样分布(一)(一个总体参数推断时样本统计量的抽样分布),一、抽样分布的概念二、样本均值的抽样分布三、样本比率的抽样分布四、样本方差的抽样分布,样本统计量的概率分布,是一种理论分布在重复选取容量为n的样本时,由该统计量的所有可能取值形成的相对频数分布。随机变量是 样本统计量样本均值,样本比例,样本方差等结果来自容量相同的所有可能样本提供了样本统计量长远而稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据,一、抽样分布的概念(sampling distribution),抽样分布的形成过程(sampling distribution),在重复选取容量为n的样本时,由样本均值的所有可能取值形成的相对频数分布一种理论概率分布推断总体均值的理论基础,二、样本均值的抽样分布,1、样本均值的抽样分布(例题分析),【例】设一个总体,含有4个元素(个体),即总体单位数N=4。4 个个体分别为x1=1,x2=2,x3=3,x4=4。总体的均值、方差及分布如下,均值和方差,样本均值的抽样分布(例题分析),现从总体中抽取n2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果为,样本均值的抽样分布(例题分析),计算出各样本的均值,如下表。并给出样本均值的抽样分布,样本均值的分布与总体分布的比较(例题分析),=2.5 2=1.25,总体分布,2、样本均值的抽样分布 与中心极限定理,当总体服从正态分布N(,2)时,来自该总体的所有容量为n的样本的均值x也服从正态分布,x 的数学期望为,方差为2/n。即xN(,2/n),中心极限定理(central limit theorem),中心极限定理:设从均值为,方差为 2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为、方差为2/n的正态分布,中心极限定理(central limit theorem),x 的分布趋于正态分布的过程,样本均值的数学期望样本均值的方差重复抽样不重复抽样,3、样本均值抽样分布的数学特征(数学期望与方差),样本均值的抽样分布(数学期望与方差),比较及结论:1.样本均值的均值(数学期望)等于总体均值 2.样本均值的方差等于总体方差的1/n,抽样分布与总体分布的关系,总体分布,正态分布,非正态分布,大样本,小样本,正态分布,正态分布,非正态分布,4、标准误(standard error),样本统计量的抽样分布的标准差,称为统计量的标准误,也称为标准误差,也称抽样标准差。标准误衡量的是统计量的离散程度,它测度了用样本统计量估计总体参数的精确程度以样本均值的抽样分布为例,在重复抽样条件下,样本均值的标准误为 4、标准差的英文为:standard deviation,估计的标准误(standard error of estimation),当计算标准误时涉及的总体参数未知时,用样本统计量代替计算的标准误,称为估计的标准误以样本均值的抽样分布为例,当总体标准差未知时,可用样本标准差s代替,则在重复抽样条件下,样本均值的估计标准误为,三、样本比率的抽样分布,比率是指总体(或样本)中具有某种属性的单位与全部单位总数之比不同性别的人与全部人数之比合格品(或不合格品)与全部产品总数之比总体比例可表示为样本比例可表示为,在重复选取容量为n的样本时,由样本比例的所有可能取值形成的相对频数分布一种理论概率分布当样本容量很大时,样本比例的抽样分布可用正态分布近似 推断总体比例的理论基础,样本比例的抽样分布,样本比例的数学期望样本比例的方差重复抽样不重复抽样,样本比例的抽样分布(数学期望与方差),3.3 抽样分布(二)(两个总体参数推断时样本统计量的抽样分布),一、两个样本均值之差的抽样分布二、两个样本比例之差的抽样分布三、两个样本方差比的抽样分布,两个总体都为正态分布,即,两个样本均值之差 的抽样分布服从正态分布,其分布的数学期望为两个总体均值之差方差为各自的方差之和,一、两个样本均值之差的抽样分布,两个总体都服从二项分布分别从两个总体中抽取容量为n1和n2的独立样本,当两个样本都为大样本时,两个样本比例之差的抽样分布可用正态分布来近似分布的数学期望为方差为各自的方差之和,二、两个样本比例之差的抽样分布,3.4 中心极限定理的应用,1、从一个标准差为5的总体中抽出一个容量为40的样本,样本均值为25,样本均指的抽样标准差是多少?2、从0.4的总体中,抽取一个容量为100的样本,问p的数学期望是多少?P的标准差是多少?P的分布是什么?,不像其他科学,统计从来不打算使自己完美无缺,统计意味着你永远不需要确定无疑。Gudmund R.Iversen,3.5 参数估计,参数估计的一般问题 3.5.2 一个总体参数的区间估计3.5.3 两个总体参数的区间估计3.5.4 样本容量的确定,学习目标,1、估计量与估计值的概念2、点估计与区间估计的区别3、评价估计量优良性的标准4、一个总体参数的区间估计方法5、两个总体参数的区间估计方法6、样本容量的确定方法,参数估计在统计方法中的地位,3.5.1 参数估计的一般问题,一、估计量与估计值二、点估计与区间估计三、评价估计量的标准,估计量:用于估计总体参数的随机变量如样本均值,样本比率、样本方差等例如:样本均值就是总体均值 的一个估计量参数用 表示,估计量用 表示估计值:估计参数时计算出来的统计量的具体值如果样本均值 x=80,则80就是的估计值,一、估计量与估计值(estimator&estimated value),二、点估计和区间估计(一)点估计(point estimate),用样本的估计量直接作为总体参数的估计值例如:用样本均值直接作为总体均值的估计例如:用两个样本均值之差直接作为总体均值之差的估计没有给出估计值接近总体参数程度的信息点估计的方法有矩估计法、顺序统计量法、最大似然法、最小二乘法等,2、区间估计(interval estimate),在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减抽样误差而得到的根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量比如,某班级平均分数在7585之间,置信水平是95%,区间估计的图示,将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比率称为置信水平 表示为(1-为是总体参数未在区间内的比率常用的置信水平值有 99%,95%,90%相应的 为0.01,0.05,0.10,置信水平,由样本统计量所构造的总体参数的估计区间称为置信区间统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间 用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值我们只能是希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个,置信区间(confidence interval),置信区间与置信水平,置信区间(95%的置信区间),重复构造出的20个置信区间,点估计值,影响区间宽度的因素,1、总体数据的离散程度,用 来测度2、样本容量,3、置信水平(1-),影响 z 的大小,三、评价估计量的标准无偏性(unbiasedness),无偏性:估计量抽样分布的数学期望等于被估计的总体参数,有效性(efficiency),有效性:对同一总体参数的两个无偏点估计 量,有更小标准差的估计量更有效,一致性(consistency),一致性:随着样本容量的增大,估计量的值越来越接近被估计的总体参数,3.5.2 一个总体参数的区间估计,一、总体均值的区间估计二、总体比率的区间估计三、总体方差的区间估计,一个总体参数的区间估计,一、总体均值的区间估计(大样本),假定条件总体服从正态分布如果不是正态分布,可由正态分布来近似(n 30)使用正态分布统计量 z,总体均值 在1-置信水平下的置信区间为,总体均值的区间估计(例题分析),【例】一家食品生产企业以生产袋装食品为主,为对产量质量进行监测,企业质检部门经常要进行抽检,以分析每袋重量是否符合要求。现从某天生产的一批食品中随机抽取了25袋,测得每袋重量如下表所示。已知产品重量的分布服从正态分布,且总体标准差为10g。试估计该批产品平均重量的置信区间,置信水平为95%,总体均值的区间估计(例题分析),解:已知N(,102),n=25,1-=95%,z/2=1.96。根据样本数据计算得:总体均值在1-置信水平下的置信区间为,该食品平均重量的置信区间为101.44g109.28g,总体均值的区间估计(例题分析),【例】一家保险公司收集到由36投保个人组成的随机样本,得到每个投保人的年龄(周岁)数据如下表。试建立投保人年龄90%的置信区间,总体均值的区间估计(例题分析),解:已知n=36,1-=90%,z/2=1.645。根据样本数据计算得:总体均值在1-置信水平下的置信区间为,投保人平均年龄的置信区间为37.37岁41.63岁,二、总体均值的区间估计(小样本),1.假定条件总体服从正态分布,且方差()未知小样本(n 30)使用 t 分布统计量,总体均值 在1-置信水平下的置信区间为,t 分布,t 分布是类似正态分布的一种对称分布,它通常要比正态分布平坦和分散。一个特定的分布依赖于称之为自由度的参数。随着自由度的增大,分布也逐渐趋于正态分布,总体均值的区间估计(例题分析),【例】已知某种灯泡的寿命服从正态分布,现从一批灯泡中随机抽取16只,测得其使用寿命(小时)如下。建立该批灯泡平均使用寿命95%的置信区间,总体均值的区间估计(例题分析),解:已知N(,2),n=16,1-=95%,t/2=2.131 根据样本数据计算得:,总体均值在1-置信水平下的置信区间为,该种灯泡平均使用寿命的置信区间为1476.8小时1503.2小时,三、总体比率的区间估计,1.假定条件总体服从二项分布可以由正态分布来近似使用正态分布统计量 z,总体比率在1-置信水平下的置信区间为,总体比率的区间估计(例题分析),【例】某城市想要估计下岗职工中女性所占的比率,随机地抽取了100名下岗职工,其中65人为女性职工。试以95%的置信水平估计该城市下岗职工中女性比率的置信区间,解:已知 n=100,p65%,1-=95%,z/2=1.96,该城市下岗职工中女性比率的置信区间为55.65%74.35%,*3.5.3 两个总体参数的区间估计,一、两个总体均值之差的区间估计二、两个总体比率之差的区间估计三、两个总体方差比的区间估计,一、两个总体参数的区间估计,(一)两个总体均值之差的估计(独立大样本),1、假定条件两个总体都服从正态分布,1、2已知若不是正态分布,可以用正态分布来近似(n130和n230)两个样本是独立的随机样本2、使用正态分布统计量 z,两个总体均值之差的估计(大样本),3、1,2已知时,两个总体均值之差1-2在1-置信水平下的置信区间为,4、1、2未知时,两个总体均值之差1-2在1-置信水平下的置信区间为,两个总体均值之差的估计(例题分析),【例】某地区教育委员会想估计两所中学的学生高考时的英语平均分数之差,为此在两所中学独立抽取两个随机样本,有关数据如右表。建立两所中学高考英语平均分数之差95%的置信区间,两个总体均值之差的估计(例题分析),解:两个总体均值之差在1-置信水平下的置信区间为,两所中学高考英语平均分数之差的置信区间为5.03分10.97分,3.5.4 样本容量的确定,一、估计总体均值时样本容量的确定二、估计总体比率时样本容量的确定三、估计总体均值之差时样本容量的确定四、估计总体比率之差时样本容量的确定,估计总体均值时样本容量n为样本容量n与总体方差 2、允许误差E、可靠性系数Z或t之间的关系为与总体方差成正比与允许误差成反比与可靠性系数成正比,一、估计总体均值时样本容量的确定,其中:,估计总体均值时样本容量的确定(例题分析),【例】拥有工商管理学士学位的大学毕业生月薪的标准差大约为2000元,假定想要估计月薪95%的置信区间,希望允许误差为400元,应抽取多大的样本容量?,估计总体均值时样本容量的确定(例题分析),解:已知=2000,E=400,1-=95%,z/2=1.96 应抽取的样本容量为,即应抽取97人作为样本,根据比率区间估计公式可得样本容量n为,二、估计总体比率时样本容量的确定,E的取值一般小于0.1 未知时,可取最大值0.5,其中:,估计总体比率时样本容量的确定(例题分析),【例】根据以往的生产统计,某种产品的合格率约为90%,现要求允许误差为5%,在求95%的置信区间时,应抽取多少个产品作为样本?,解:已知=90%,=0.05,z/2=1.96,E=5%,应抽取的样本容量为,应抽取139个产品作为样本,本章小结,参数估计的一般问题一个总体参数的区间估计两个总体参数的区间估计(不要求)样本容量的确定,1、根据以往的生产数据,某种产品的废品率为2,如果以95的置信水平要求误差范围不超过4,则应抽取多大的样本?,某电泡厂对2000个灯泡进行寿命检验,随机抽取2进行测试,得出样本灯泡平均使用寿命为1057.63小时,合格率为91.75%,灯泡平均使用时间抽样平均误差为2.6535小时,要求在68.27和95.45的概率保证下,求平均数和成数的置信区间。,北京大学2001年统计学专业考研试题(10分),某地区共有40000名居户,为了了解居民中装有空调的数量,从中随机的抽取400户,其中有232户装有空调,试分别对总体比率和该地区空调总量进行区间估计。(置信水平为95),中国人大1999年统计学专业考研试题(15分),补充:不同抽样组织方式下的抽样估计,基本的组织方式:简单随机 类型 等距 整群 多阶段,也叫纯随机抽样,需先对总体 进行编号。常用方法:随机数字表法 抽签法 计算机取数法,简单随机抽样,随机数字表(节选),也叫分层抽样。将差异较大的总体划分为M个内部差异较小的子总体。分为等比例抽样和不等比例抽样,类型抽样,当 时,,举例,某厂有两个车间生产保温瓶胆,乙产量是甲的2倍,按产量比例共抽了60支调查其保温时间。以95%的概率推断该厂生产的全部产品的保温时间。,解:M=2,举例,某地区有10000户居民,按城市和农村户比例,按不重置抽样方法抽取1000户,调查空调拥有量的比重,发现:试以80%的概率推断该地区空调拥有户比重的范围。,解:M=2,无关标志排队抽样类似于简单随机抽,起点可以随机确定。有关标志排队抽样 随机起点等距抽 半距起点等距抽 对称等距抽,先将总体划分成若干群(组),然后按随机原则从中抽取若干,对被抽中的群的所有单位进行全面调查。,整群抽样,优点:节约 方便 R 中,抽 r特点:不重复抽样;群内不产生抽样误差,举例,两阶段第一阶段:从R中抽取r第二阶段:从M中抽m令,多阶段抽样,

    注意事项

    本文(抽样分布和估计.ppt)为本站会员(牧羊曲112)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开