统计学抽样与参数.ppt
《统计学抽样与参数.ppt》由会员分享,可在线阅读,更多相关《统计学抽样与参数.ppt(94页珍藏版)》请在三一办公上搜索。
1、第 5 章 抽样与参数估计,统计推断的过程,2010年,参数估计在统计方法中的地位,点估计,区间估计,第 5 章 抽样与参数估计,5.1 抽样与抽样分布5.2 参数估计的基本方法 5.3 总体均值的区间估计5.4 总体比例的区间估计5.5 样本容量的确定,学习目标,理解抽样方法与抽样分布估计量与估计值的概念点估计与区间估计的区别总体均值的区间估计方法总体比例的区间估计方法样本容量的确定方法,5.1 抽样与 抽样分布,一、什么是抽样推断二、概率抽样方法三、抽样分布,抽样方法,抽样方法,概率抽样(probability sampling),也称随机抽样特点按一定的概率以随机原则抽取样本抽取样本时使
2、每个单位都有一定的机会被抽中每个单位被抽中的概率是已知的,或是可以计算出来的 当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率,简单随机抽样(simple random sampling),从总体N个单位中随机地抽取n个单位作为样本,每个单位入抽样本的概率是相等的最基本的抽样方法,是其它抽样方法的基础特点简单、直观,在抽样框完整时,可直接从中抽取样本用样本统计量对目标量进行估计比较方便局限性当N很大时,不易构造抽样框抽出的单位很分散,给实施调查增加了困难没有利用其它辅助信息以提高估计的效率,分层抽样(stratified sampling),将抽样单位按某种特征或某种规则划分为
3、不同的层,然后从不同的层中独立、随机地抽取样本优点保证样本的结构与总体的结构比较相近,从而提高估计的精度组织实施调查方便既可以对总体参数进行估计,也可以对各层的目标量进行估计,整群抽样(cluster sampling),将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查特点抽样时只需群的抽样框,可简化工作量调查的地点相对集中,节省调查费用,方便调查的实施缺点是估计的精度较差,系统抽样(systematic sampling),将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其它样本单位
4、先从数字1到k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k等单位优点:操作简便,可提高估计的精度缺点:对估计量方差的估计比较困难,1从含有N个元素的总体中,抽取n个元素作为样本,使得总体中的每一个元素都有相同的机会(概率)被抽中,这样的抽样方式称为()A简单随机抽样 B分层抽样 C系统抽样 D整群抽样,2从总体中抽取一个元素后,把这个元素放回到总体中再抽取第二个元素,直至抽取n个元素为止,这样的抽样方法称为()A重复抽样 B不重复抽样 C分层抽样 D整群抽样,3一个元素被抽中后不再放回总体,然后再从所剩下的元素中抽取第二个元素,直到抽取n个元素为止,这样的抽样方法称为()A重
5、复抽样 B不重复抽样 C分层抽样 D整群抽样,4在抽样之前先将总体的元素划分为若干类,然后从各个类中抽取一定数量的元素组成一个样本,这样的抽样方式称为()A简单随机抽样 B分层抽样 C系统抽样 D整群抽样,5先将总体各元素按某种顺序排列,并按某种规则确定一个随机起点,然后,每隔一定的间隔抽取一个元素,直至抽取n个元素形成一个样本。这样的抽样方式称为()A简单随机抽样 B分层抽样 C系统抽样 D整群抽样,6先将总体划分成若干群,然后在以群作为抽样单位从中抽取部分群,再对抽中的各个群中所包含的所有元素进行观察,这样的抽样方式称为()A简单随机抽样 B分层抽样 C系统抽样 D整群抽样,抽样分布,在重
6、复选取容量为n的样本时,由每一个样本算出的该统计量数值的相对频数分布或概率分布 是一种理论分布随机变量是 样本统计量样本均值,样本比例,样本方差等结果来自容量相同的所有可能样本提供了样本统计量长远我们稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据,抽样分布(sampling distribution),抽样分布(sampling distribution),抽样分布是指()A一个样本各观测值的分布 B总体中各观测值的分布 C样本统计量的分布 D样本数量的分布,样本均值的抽样分布,容量相同的所有可能样本的样本均值的概率分布一种理论概率分布进行推断总体均值的理论基础,样本均值的抽样
7、分布,样本均值的抽样分布(例题分析),【例】设一个总体,含有4个元素(个体),即总体单位数N=4。4 个个体分别为x1=1、x2=2、x3=3、x4=4。总体的均值、方差及分布如下(P88-89),均值和方差,样本均值的抽样分布(例题分析),现从总体中抽取n2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果为,样本均值的抽样分布(例题分析),计算出各样本的均值,如下表。并给出样本均值的抽样分布,样本均值的分布与总体分布的比较(例题分析),=2.5 2=1.25,总体分布,样本均值的抽样分布与中心极限定理,当总体服从正态分布N(,2)时,来自该总体的所有容量为n的样本的均值
8、X也服从正态分布,X 的数学期望为,方差为2/n。即XN(,2/n),中心极限定理(central limit theorem),中心极限定理:设从均值为,方差为 2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为、方差为2/n的正态分布(P90),2010年,中心极限定理(central limit theorem),x 的分布趋于正态分布的过程,2010年,抽样分布与总体分布的关系(P90),总体分布,正态分布,非正态分布,大样本,小样本,样本均值正态分布,样本均值正态分布,样本均值非正态分布,样本均值的数学期望样本均值的方差重复抽样不重复抽样,样本均值的
9、抽样分布(数学期望与方差),样本均值的抽样分布(数学期望与方差),比较及结论:1.样本均值的均值(数学期望)等于总体均值 2.样本均值的方差等于总体方差的1/n,1.根据中心极限定理可知,当样本容量充分大时,样本均值的抽样分布服从正态分 布,其分布的均值为()A.B./n C D./n 2.根据中心极限定理可知,当样本容量充分大时,样本均值的抽样分布服从正态分布,其分布的方差为()A./B./n C./n D./,3中心极限定理表明,如果容量为n的样本来自于任意分布的总体,则样本均值的分布为()A正态分布 B只有当n30时为正态分布 C只有当n30时为正态分布 D非正态分布,样本比例的抽样分布
10、,总体(或样本)中具有某种属性的单位与全部单位总数之比不同性别的人与全部人数之比合格品(或不合格品)与全部产品总数之比总体比例可表示为样本比例可表示为,比例(proportion),容量相同的所有可能样本的样本比例的概率分布当样本容量很大时,样本比例的抽样分布可用正态分布近似 一种理论概率分布推断总体比例的理论基础,样本比例的抽样分布,样本比例的数学期望样本比例的方差重复抽样不重复抽样,样本比例的抽样分布(数学期望与方差),5.2 参数估计的基本方法,一、估计量与估计值二、点估计与区间估计,估计量与估计值,参数估计(parameter estimation)就是用样本统计量去估计总体的参数估计
11、量:用于估计总体参数的随机变量如样本均值,样本比例、样本方差等例如:样本均值就是总体均值 的一个估计量参数用 表示,估计量用 表示估计值:估计参数时计算出来的统计量的具体值如果样本均值 x=80,则80就是的估计值,估计量与估计值(estimator&estimated value),点估计与区间估计,参数估计的方法,点估计(point estimate),1.用样本的估计量 的值直接作为总体参数的估计值例如:用样本均值直接作为总体均值的估计例如:用两个样本均值之差直接作为总体均值之差的估计2.没有给出估计值接近总体参数程度的信息3.点估计的方法有矩估计法、顺序统计量法、最大似然法、最小二乘法
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 抽样 参数

链接地址:https://www.31ppt.com/p-5299691.html