《数据收集》PPT课件.ppt
《《数据收集》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《数据收集》PPT课件.ppt(84页珍藏版)》请在三一办公上搜索。
1、第 二 章 数据收集,第一节 数据的直接来源与间接来源第二节 数据的收集方法第三节 问卷设计第四节 收集数据的误差,第一节 数据来源 数据是怎样得到的?,数据的间接来源(二手数据的来源),来源,特点,评估,二手数据的收集,一般称为文案调查步骤:1.根据研究项目的内容判别所需要的资料的类型2.寻找资料来源3.资料的查找4.对数据资料进行加工整理和补充,二手数据的来源,统计部门和政府部门公布的有关资料,如各类统计年鉴各类经济信息中心、信息咨询机构、专业调查机构等提供的数据各类专业期刊、报纸、书籍所提供的资料各种会议,如博览会、展销会、交易会及专业性、学术性研讨会上交流的有关资料从互联网或图书馆查阅
2、到的相关资料,二手数据的特点,收集容易,采集成本低作用广泛分析所要研究的问题提供研究问题的背景帮助研究者更好地定义问题检验和回答某些疑问和假设寻找研究问题的思路和途径收集二手资料在研究中应优先考虑,二手数据的评估,数据是谁收集的?可信度评估为什么目的而收集的?数据是怎样收集的?什么时候收集的?,数据的直接来源(原始数据的来源),观测数据(调查数据),试验数据,在自然的没有被控制的条件下观测到的,在人工干预和操作的情况挖收集的数据,统计调查数据,统计调查方式全面调查:普查抽样调查:主观抽样调查(典型调查,重点调查,配额抽样调查)概率抽样调查,主观(非概率)抽样,非概率抽样是用主观的(非随机的)方
3、法从总体中抽选单元,是一种快速、简易且节省的从总体中选取样本单元的方法。由于非概率抽样抽取样本有倾向性与偏差且没有一个抽样框,不可能计算出各个单元的入样概率。从而无法得到总体目标量的可靠估计值及其抽样误差估计值。,主观(非概率)抽样的优点,快速简便;费用相对较低;不需要抽样框;对探索性研究和调查的设计开发很有用。所以在市场调查中广泛应用,主观抽样(非概率抽样)的缺点,为了对总体进行推断,需要对样本的代表性做很强的假定。不可能得到可靠的估计值以及抽样误差估计值。,非概率抽样的种类,非概率抽样方法有:随意抽样方便抽样自愿抽样自我选择判断抽样配额抽样雪球抽样,方便抽样随意抽样,随意抽样的样本单元的抽
4、选以无目标、随意的方式进行,几乎没有或完全没有计划。它假定总体是同质的,即总体单元都相似。比如“街道拦截”访问法。,自我选择志愿抽样,让个体自愿参加调查。被调查者都是志愿者。例如具有特定病情的人参加某些医疗实验;打电话参与广播或电视节目的人;抽选参加焦点座谈或深入访问的人。,判断抽样,由专家有目的地抽选有代表性的样本。它适用于探索性研究,如:抽选参加焦点座谈或深入访谈的人,但不宜用在试调查中。是方便抽样的延伸。,配额抽样,这是最常见的一种非概率抽样。抽样要从各个子总体中选取特定数量的单元(配额)。总样本量:900人,雪球抽样,用于感兴趣的样本特征较稀有的情况,依赖于一个目标推荐另一个目标的方法
5、。,非概率抽样的种类,非概率抽样方法有:随意抽样方便抽样自愿抽样自我选择判断抽样配额抽样雪球抽样,概率抽样,概率抽样有两条基本准则:单元是随机抽取的;调查总体中的每个单元都有一个非零的入样概率,并且能计算出这些概率。,概率抽样的主要优、缺点:,能得到总体的可靠估计值并能计算每个估计值的抽样误差,因而能对总体进行推断。与非概率抽样相比,概率抽样比较复杂,更费时,通常也更费钱。但总的说来,其利远大于弊。,概率抽样的种类,概率抽样有七种:简单随机抽样,系统抽样,整群抽样,分层抽样,多级抽样,,23,(1)简单随机抽样(Simple Random Sampling),也称纯随机抽样。直接从总体单位中抽
6、选样本单位,每个个体被选入样本的概率都相等。可分为有放回和无放回两种方式。是最基本的抽样方法,许多抽样方法都是在它的基础上发展起来的。其数学性质简单,理论也最为成熟。,24,有放回抽样和无放回抽样,有放回抽样:也称为重复抽样,在一个单位被选入样本后,记录其编号,然后又将其放回总体中继续参与随后的抽样过程。无放回抽样:也称为不重复抽样,在一个单位被选入样本后,不再放回总体参与随后的抽样过程。,问题:不重复抽样中每个个体被选中的概率相等吗?,25,抽选样本单位的方法,从N个总体单位中抽选n个单位组成样本,可以先将N个单位编号,若抽到某个号则对应的单位入样。通常有抽签法和随机数法两种抽选方法。抽签法
7、:用均匀同质的材料制作N个签并充分混合,然后一次抽取n个签,或一次抽取一个签但不放回,直至抽满n个签为止。随机数法:随机数表随机数骰子摇奖机计算机产生的伪随机数,26,随机数表的使用,39 65 76 45 45 19 90 69 64 61 20 26 36 31 62 73 71 23 70 90 65 97 60 12 11 98 40 07 17 66 72 20 47 33 84 51 67 47 97 19 98 40 07 17 66 75 17 25 69 17 17 95 21 78 58 24 33 45 77 48 37 48 79 88 74 63 52 06 34 3
8、0 01 31 60 10 27 02 89 08 16 94 85 53 83 29 95 56 27 09 24 43,27,简单随机抽样最适用的场合,当总体内样本单位不多,且有完备名册,可用于编号时对研究的目的而言,总内样本单位间的差异不大时无法充分获得总体信息时由于编制抽样框及抽取的样本可能过于分散等原因在实际实施中有一定困难,加之没有利用其他辅助信息提高估计的效率,所以大规模调查中很少直接采用。,28,(2)系统抽样(Systematic Sampling),系统抽样(也称等距抽样):将总体N个单位按某种顺序排列,按规则确定一个随机起点,再每隔一定间隔逐个抽取样本单位的抽样方法。直线
9、等距抽样:将总体分成n个组,每组有 k=N/n个单位。在第一组随机选择一个单位,之后每隔k个选择一个。,N=64n=8k=8,第一组,29,等距抽样的特点,等距抽样可分为无关标志排队和有关标志排队。按无关标志排队:各单元的排队顺序与所研究的内容无关按有关标志排队:各单元的排队顺序与所研究的内容有关系。优点:抽取样本简便易行,易于监控。主要适用场合总体内的样本单位,对有兴趣的指标而言是随机的或按大小排列的总体内单位数过多,而抽取的样本又较多时总体内的单位数不能确定时(例如抽取学号最后一位为8的学生进行调查),30,按无关标志排队时等距抽样的特点,按无关标志排队时,如果单位的排列存在周期性,而抽样
10、间隔又恰好与周期的长度一致时,样本的代表性可能很差,31,按有关标志排队时等距抽样的特点,按有关标志排队时,相应的指标数值有线性趋势,按照普通的等距抽样方法会导致样本指标的偏大或偏小。为了避免这一问题需要采取对称等距抽样的方法。这时样本单位在总体中分布比较均匀,有利于提高估计的精度。,直线等距,对称等距,对称等距,32,(3)分层抽样 Stratified Sampling,也称分类抽样或类型抽样。即先将总体所有单位按某种标志划分为若干层,然后从各层中随机抽取一定数目的单位构成样本,根据各层样本汇总对总体指标作出估计的一种抽样方式。,男生,女生,样本,33,分层抽样的特点,可以提高样本的代表性
11、,提高估计的精度。在估计总体参数的同时还能估计每层的参数。抽样误差只受层内方差的影响,分层时应使层间方差大、层内方差小。最适用的场合:当总体内样本单位的差异较大时;分层后能达到层间差异大,层内差异小的原则时,34,按比例分层抽样和不按比例分层抽样,按比例分层抽样:各层的抽样比例都相等(等于n/N)。在有些情况下,为了降低抽样误差或者对各层的参数进行较好的估计,需要采用不按比例分层抽样。在不按比例的分层抽样中如果要用样本资料推断总体,需要对各层的数据资料进行加权处理。,35,(4)整群抽样 Cluster Sampling,先将总体分为R个群(即次级单位或子总体),每个群包含若干总体单位。按某种
12、方式从中随机抽取r个群,然后对抽中的群的所有单位都进行调查的抽样方式。,随机选择2个群构成样本,36,整群抽样的特点,样本单位比较集中,容易集中力量进行调查,便于组织与管理,也节省了调查时间和费用。不需要所有总体单位的抽样框。由于样本单位不能均匀的分布在总体中,所以样本的代表性要差一些(对策:增大样本容量)。抽样误差受群间方差的影响,不受群内方差的影响。分群时应使群间方差小。最适用的场合:总体名单不易获得时为节省调查成本时群内差异大,而群间的变异小时,37,(5)多级段抽样,先从总体中随机地抽取若干初级单位,再从初级单位中抽取若干二级单位,如此下去直至抽取所要调查的基本单位的抽样方法。例如:统
13、计年鉴2004指出 2003年人口变动情况抽样调查是以全国为总体,各省、自治区、直辖市为次总体,采用分层、等距、整群概率比例抽样方法,在全国31个省、自治区、直辖市抽取了990个县(市、区)、3734个乡(镇、街道)、6544个调查小区的126万人。,38,多阶段抽样的特点,适用于总体分布很广,不可能从总体中直接抽取样本单位的情况。不需要全部低级单位的抽样框,节省了调查费用。方法灵活多样。,抽样调查的组织方式完全取决于调查研究的目的要求、调查对象的特点和客观的条件。凡是能够最经济、最省时而又能够满足预期精确度和可靠性的组织方式,便是一种好的组织方式,这也是抽样设计的最根本的原则。,数据的直接来
14、源(原始数据的来源),观测数据(调查数据),试验数据,在自然的没有被控制的条件下观测到的,在人工干预和操作的情况挖收集的数据,实验设计方式获得数据,1.进行实验方案设计2.方案的实施3.采集数据4.进行数据的分析,第二节 数据的收集方法,一、访问法 面谈访问、电话访问、电脑辅助调查、座谈会法、个别深入访谈法二、报告法 邮寄调查、日记调查、留置调查三、观察法 直观、可靠,第三节 调查问卷设计,什么是问卷?(questionnaires),用来搜集调查数据的一种工具调查者根据调查目的和要求所设计的,由一系列问题、备选答案、说明以及码表组成的一种调查形式不同的调查问卷在具体结构、题型、措词、版式等设
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据收集 数据 收集 PPT 课件
链接地址:https://www.31ppt.com/p-5519591.html