[PPT模板]四 抽样.ppt
《[PPT模板]四 抽样.ppt》由会员分享,可在线阅读,更多相关《[PPT模板]四 抽样.ppt(51页珍藏版)》请在三一办公上搜索。
1、抽 样,抽样(Sampling):从总体中按一定方式抽取样本的过程。,一、抽样的基本概念,二、抽样的作用,向人们提供一种实现“由部分认识总体”这一目标的途径和手段。抽样主要解决的是调查对象的选取问题,即如何从总体中选出一部分对象作为总体的代表的问题。抽样方法是架构在研究者十分有限的人力、财力和时间与庞杂、广阔、纷繁、多变的社会现象之间的一座桥梁。,三、抽样的一般程序,(1)界定总体:在具体抽样前,首先对抽取样本的总体范围与界限做出明确界定。抽样调查的目的所决定;部分认识总体 达到良好抽样效果前提。(2)制定抽样框:抽集全部抽样单位的名单。并统一编号,建立起供抽样使用的抽样框。当抽样分几个阶段、
2、在几个不同的抽样层次上进行时,则要分别建立起几个不同的抽样框。,(3)决定抽样方案:确定抽样方法、样本规模及主要目标量的精确程度。(4)实际抽取样本:先抽好、后调查,边抽边调。(5)评估样本质量:对样本进行初步检验和衡量。如样本的质量、代表性、偏差等。防止偏差过大导致失误。基本方法:将可得到的反映总体中某些重要特征及其分布的资料与样本中的同类指标的资料进行对比。若二者有差别很小,则可认为样本的质量较高,代表性较大;反之,若二者之间的差别十分明显,那么代表性不高。,四、概率抽样方法,1、简单随机抽样2、系统抽样3、分层抽样4、整群抽样5、多段抽样6、PPS抽样7、户内抽样,一阶段抽样,多阶段抽样
3、,1、简单随机抽样(Simple Random Sampling)也称作纯随机抽样,它是概率抽样中最基本的一种抽样方法。按等概率原则直接从含有个元素的总体中抽取n个元素组成样本(n)()抽签法:总体大时工作量大()随机数法:随机数表、随机数扫子、计算机产生的伪随机数,由均匀材料制成的正面体,每一面上分别标有的数字各个。使用时可根据总体规划的位数,决定使用几枚子,同时规定不同的颜色代表的位数计算机产生随机数由统计软件产生的是伪随机数,在通常情况下有循环周期故一般无法保证其随机性,随机数表法:,第一步:先取得一份调查总体所有元素的名单(即抽样框);第二步:将总体中所有元素都按顺序编号;第三步:根据
4、编号的最大数确定选出的随机数的位数;第四步:决定从位数组中选择哪几位数字;第五步:确定在表中选择数字的顺序;第六步:确定开始选择的位数组起点;第七步:处理大于总体规模或重复的随机数,随机数表是由范围在0000199999内的五位数的随机数,按行和列排序构成的允许从一个规模小于万的总体中抽取简单随机样本例子:假设要从一个3000人的总体中,用简单随机抽样方法抽取一个100人样本,首先要得到一份总体成员的名单,然后对总体中的每一个人从1到3000进行编号,再根据总体的规模,确定从5位数一组的随机数表中,选择4位数。具体的选法既可以是后4位,也可以是前4位。选择的起点可以任意指定。即可以从表中任意一
5、行任意一列开始。顺序可以从左到右,有可以从右到左。既可以从上到下,也可以从下到上,然后以3000为标准对随机数表中的数码进行取舍。凡小于或等于3000的数码就选出来,凡大于3000的数码以及已经选出的数码则不要,直到选够100个号为止。最后按照所抽取的号码,从总体名单中找到它们对所对应的100成员。这100个成员就构成一个调查的样本。,随机数表应用实例(以后4位数码进行取舍),随机数表 中的数码,选用的数码,不选用的原因,90906,73020,10041,22507,04310,66042,12683,82507,51176,2683,0906,2507,0041,1176,后面4位数大于3
6、000,后面4位数大于3000,后面4位数大于3000,与所选的第三个数码重复,提醒:,只有在名单很短而且事先已将所有单位编号,或用电脑处理过,便于编号的情况下,才会使用随机抽样,否则抽样工作量太大。没有实际操作意义。,2、系统抽样(Systematic Sampling),又称等距抽样或机械抽样。即将N个总体按一定顺序排列,然后先随机抽取一个单位作为起始单位,再按某种确定的规则(固定的间隔)抽取其他n-1个样本单位。是独立于简单随机抽样的另一种办法,效果与简单随机抽样相近,但操作起来却容易的多。由于抽样使用的是抽样间距,而不是随机数,故等距抽样是一种准随机抽样方法。,(一)整数抽样间距,当是
7、n的整数倍,即抽样间距k=N/n是整数,可使用直线等距抽样即在算出抽样间距后,先在范围内抽取一个随机数r作为起点,然后每隔个单位抽出一个单位,直到抽出n个单位,抽中单位的号码分别为:r,r,r(n),实质:直线等距抽样实际上是将个单位排列成n行列的矩阵,再从列之间随机产生一个随机数r,则取第r列的全体单位做样本。这时,每一列被选中的概率是相等的,因此总体中每个单位入样的概率也是相等的。,一个例子,将总体中的每一个元素都按顺序编上号码:110000;计算出抽样间距K:已知总体规模N=10000,样本规模n=100,那么抽样间距K=N/n=10000/100=100;在最前面的100户中,采用简单
8、随机抽样的方法抽取1户,记下这户的编号。假设所抽取的这户的编号是57;在抽样框中,自57开始,每隔100就抽1户,即所抽取的家庭编号分别为:57,157,257,357,9957;将这100户组合起来,就构成了本次调查总体的一个样本。,(二)非整数抽样间距,当不是n的整数倍,即抽样间距 n不是整数时,不难看出,这时上述矩阵有些列有N个单位,有些列不足n个单位,若再利用直线等距抽样就无法保证每个总体单位以相等的概率入样。补充:循环等距抽样,循环等距抽样:先将个总体单位首尾相接排成一个封闭圆,抽样间距取最接近 n的整数,再从中随机抽取一个随机起点作为起始单位,然后每隔抽取一个单位,直到抽满n个单位
9、为止。这是由于随机起点是中的任意一个,因此每个总体单位入样的概率是相等的。,总体单位线性趋势排列:总体名单中,个体的排列具有某种次序上的先后、等级上的高低的情况。(总体单位按某个辅助变量的大小顺序排列,而这个辅助变量与所研究的指标值线性相关。如调查家庭消费情况,而家庭是按总收入多少排列的。,总体单位的排列,如从总体为2000户家庭的社区中,抽出一个50户家庭的样本进行消费状况调查,而2000家庭是按照每个家庭的总收入的多少,由高到低顺序排列的。比较两种抽样:,,补救:打乱其原来的顺序,重新编制总体名单,或者改用其他抽样方法。,总体单位周期排列,即总体单位指标按其顺序呈周期性变化。也即总体名单中
10、,个体的排列上有与抽样间隔相对应的周期性分布的情况。当抽样间距等于周期倍数时,抽到的任意一个样本单位都有相同的取值,相当于从总体中随机抽取了一个单位,这时样本的代表性最差。如按教学班排列,每班正好个学生,并且每班的名单都是按学习成绩高低或按班干部、一般学生、较差学生的顺序排列,那么抽的靠前的和靠后的完全不一样。,3、分层抽样(类型抽样)(Stratified Sampling),它是先将总体个单位,按某种特征划分成若干个子总体称为层,然后在每个层中分别独立地进行抽样,最后将抽出的子样本合起来构成总体的样本。基本目的:把异质性较强的总体分成一个个同质性较强的子总体。分层的指标:要对研究的变量有很
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- PPT模板 PPT模板四 抽样 PPT 模板

链接地址:https://www.31ppt.com/p-4595108.html