调查资料的统计处理与显示.ppt
《调查资料的统计处理与显示.ppt》由会员分享,可在线阅读,更多相关《调查资料的统计处理与显示.ppt(118页珍藏版)》请在三一办公上搜索。
1、1,第七章调查资料的统计处理与显示,2,定量资料的来源有两个,一是实地源,二是文献源。前者包括问卷资料、结构性访问和观察的记录等等,后者主要是统计资料。由于统计资料的整理较问卷资料和结构性观察资料要简单,步骤要少。,第七章 调查资料的统计处理与显示,3,问卷资料是以定量地把握社会现象和人们的态度为目的而收集的,因此,整理要求更细心,人手更多和没有误差的客观化程序,其过程通常分为资料审核、资料编码、数据输入、数据清理及数据汇总五个阶段。,第七章 调查资料的统计处理与显示,4,第一节 资料审核,资料的审核是指研究者对所收集的原始资料(主要是问卷)进行初步的审阅,校正错填、误填的答案,剔除乱填、空白
2、和严重缺答的废卷。其目的是使得原始资料具有较好的准确性、完整性和真实性,从而为后续资料整理录入与统计分析工作打下较好的基础。,5,第一节 资料审核,一、资料审核的内容二、资料审核的方式,6,一、资料审核的内容,1、资料的完整性审核2、资料的准确性审核3、资料的真实性审核,7,1、资料的完整性审核,对资料的完整性审核,主要是检查应该进行调查的单位或个体是否都进行了调查;检查问卷是否填写完整以及数据质量是否符合要求;检查所有调查项目或指标是否填写齐全,是否出现错填、误填、乱填的情况。,8,2、资料的准确性审核,主要检查那些含混不清的、不具体的以及相互矛盾的资料。为此可采用以下方法,第一,逻辑检查,
3、即从资料的逻辑关系来检验其是否正确真实。第二,计算检查,就是通过各种数字运算来检查各项数字的正确性。,9,3、资料的真实性审核,资料的真实性审核包括两个方面的内容:一是资料来源的客观性,即调查资料确实是调查者通过实地调查获得的资料,而不是调查者主观杜撰的东西。二是资料本身的真实性问题。,10,二、资料审核的方式,1、实地审核2、集中审核3、审核结果的处理,11,1、实地审核,整个审核工作要经历三个阶段:第一阶段,是由调查员进行审查。第二阶段,由现场专职的检察员进行检查。第三阶段,是在调查结束后由调查组织机关的检查员进行检查,重点是检查回答登记错误,计算错误及调查员是否对应调查对象进行了调查,有
4、无作弊等。,12,2、集中审核,整个审核工作是先将资料全部收回,然后集中时间进行审核,主要由调查的组织者进行审核。优点是便于统一组织安排和管理,审核标准一致,检查质量相对好些。,13,3、审核结果的处理,审核结果的处理通常有两种方式:一种是问卷的回访,研究者在回收调查资料后,由其他人对所调查的样本中的一部分个案进行第二次调查,以检查和核实第一次调查的质量。另一种是对于审核的结果进行筛选和剔除。,14,第二节 资料编码,编码是给每个问题及答案一个数字作为它的代码。从资料处理的角度看,编码就是用阿拉伯数字来代替问卷中每一个问题的回答,或者说是将问卷中的答案转换成数字的过程。,15,第二节 资料编码
5、,一、编码方式二、答案代码的确定三、编码的具体方法四、编制编码手册,16,一、编码方式,对资料编码的方法,主要有三种:预编码、后编码和边缘编码。,17,一、编码方式,(1)预编码。预编码的方法,是在设计问卷时对回答的每一个种类都指定好其编码值,并印在问卷上。预编码主要限于回答类别事先已知的问题,这些问题主要是封闭性问题,或回答已经是数字而不需作转换的问题。如,调查高中生高考的志愿.,18,一、编码方式,预编码的长处是处理资料时比较简单,省力省时。它的缺点显然是无法用于开放性回答,因为我们无法事先知道回答的种类。,19,一、编码方式,(2)后编码。后编码是指对问卷的编码过程是在问卷回收之后进行的
6、,而不是与问卷设计同时进行的,多用于开放性问题的编码。,20,一、编码方式,(3)边缘编码。边缘编码实际上是一种预编码的方法,它与前面所讲的预编码的不同之处在于,这种方法不仅指定了编码值,而且给出了每个项目记录回答的空间,现在应用的最多。,21,二、答案代码的确定,编码分为两部,第一步是对回答进行分类,第二步是建立回答类别与变量数值间的对应关系。对问题进行分类,指的是在设计问卷时,每一个指标或变量设置几个选项的问题。,22,二、答案代码的确定,例:调查问卷:A1.您的性别:男 女 A2.您的婚姻状况:未婚 已婚 离异 丧偶 A3.您是哪一年到该市打工的?年 A4.您现在的工作是:,23,二、答
7、案代码的确定,问题的代码分别是A1、A2、A3、A4,问题中每个答案的数字就是答案代码,A2中“1”表示“未婚”,“2”表示“已婚”,“3”表示“离异”,“4”表示“丧偶”。,24,二、答案代码的确定,编码时,除了对指标或变量的答案进行编码外,问卷编号、访问员编号等信息一般也要进行编码,输入数据库。,25,三、编码的具体方法,1、单项选择题的编码2、多项选择题的编码3、开放性问题的编码4、编码常用的规则5、答案栏编码的确定,26,1、单项选择题的编码,给出的答案至少有两个,回答者根据自己的情况选择一个答案作为回答的单项选择题目,通常直接使用问卷设计时赋予每一个答案的数值作为其代码值,如前面A1
8、、A2题每个答案前面的数字就是其代码值,编码时直接将这些数字填写在编码栏即可。,27,2、多项选择题的编码,(1)不确定选择个数的多项选择题(2)确定选择个数的多项选择题,28,(1)不确定选择个数的多项选择题,不确定选择个数的多项选择题指的是在调查时不设定回答者对某一问题的选择答案的数目。编码一般采用“0,1”形式,如果选择了,则标记为“1”,没有选择,则标记为“0”。,29,(2)确定选择个数的多项选择题,采用“0,1”编码。用答案前的数字作为代码。,30,2、多项选择题的编码,对于问卷中的那些跳答/不适用的题目一般用9,99,999等固定的代码。应该填答而没有填答的题目用0或空格来表示,
9、在录入的过程中,可直接空过去,以免与其他有意义的数字代码相混淆。,31,3、开放性问题的编码,如果针对的是定距或定比变量,可以直接用填答的数字进行编码。,32,3、开放性问题的编码,而对于非数值型的题目,则先制作编码本,为其中的每一个选项设计一个代码,再进行编码,如“您的专业是?”,调查完成之后,可以根据随机抽取的一些样本的情况设定代码,如“1=社会学,2=经济学,3=教育学”进行编码,并录入。,33,4、编码常用的规则,(1)使用统一的编码表和编码手册。(2)对答案完整的有问题的编码,可以根据编码表直接进行编码。(3)对选择答案,有笔误和错别字,但不影响内容的判别时,也根据编码表直接编码。,
10、34,4、编码常用的规则,(4)对答案不明确,或者回答者答非所问,不合逻辑的答案,一般不要进行编码,而是记录下问卷编号、题号等,告知负责人统一处理。(5)当一个意见在编码表上找不到合适的编码时,编码员不得私自加新码,应向编码督导询问处理办法。,35,4、编码常用的规则,(6)在编码时还经常会遇到半开放型题目“其他”选项中的答案的处理,这是需要确认写在“其他”位置的内容是否已出现在问卷所列出的选项中,若已有,则用答案中已有的代码进行编码,若没有,才按其它选项另作处理。,36,5、答案栏编码的确定,每个问题答案代码的位数通常称为编码的宽度。栏码则是在数据转录到登记表上或者录入数据库时每个变量所处的
11、位置,它是根据每个指标或问题答案代码的位数,确定该项目或问题所占的宽度,再根据前后顺序来确定其在整个数据排列中所处的位置,从前依次往后排列。,37,四、编制编码手册,无论哪一种编码方法,都必须制作编码簿,用以指示每个编码的意义和变量的位置。编码簿可以作为编码工作的指南;它可以使研究者在分析过程中便于查找变量及各个编码所代表的意义。编码簿包括以下五个主要项目:,38,四、编制编码手册,(1)问题号码。是在调查表或问卷上的问题的题号,有了题号就可以知道这一题目在资料卡片上的哪几列。,39,四、编制编码手册,(2)变量号码。变量号码是研究者自己为各变量所编的号码,有了变量号码后,研究者可知变量的代号
12、,以利分析计划的拟订,在分析时直接引用变量号码而不必提及变量名称。,40,四、编制编码手册,(3)项目名称。又称变量名称,用概括性的语言表明项目的含义,使研究者对于该变量的含义一目了然。(4)编码的内容说明。即给出每一项问题答案的分类以及分配给每一类别的数字。,41,四、编制编码手册,(5)列序号。即每一项目应当占哪几列。在每个个案是由两个或两个以上横行的数据组成的情况下,常设有横行序号一栏,表明变量的横行位置。,42,第三节 数据输入,一、人工输入数据二、其他输入方式,43,一、人工输入数据,人工输入数据的方式主要有两种:一是直接从问卷上将编好码的数据输入计算机;另一种是先将问卷上编好码的数
13、据转录到专门的登录表上,然后再从登录表上将数据输入计算机。一般都是直接将编好码的数据输入计算机。,44,1、SPSS软件简介,SPSS软件是世界上著名的统计分析软件之一。它使用Windows的窗口方式展示各种管理和分析数据方法的功能,使用对话框展示工作功能选择项。它的基本功能包括数据管理、统计分析、图表分析、输出管理等。,45,1、SPSS软件简介,SPSS软件操作简单,双击SPSS图标,进入SPSS数据编辑器窗口。SPSS软件具有菜单功能和窗口功能,包括文件、编辑、视图、数据、转换、统计分析、图形、工具、窗口转换、帮助十项菜单功能。,46,2、数据输入,(1)变量名(2)变量数据类型(3)变
14、量宽度(4)小数点位数(5)变量名标签(6)变量值标签(7)缺失值设置(8)变量值的宽度和排列方式(9)变量类型,47,二、其他输入方式,1、计算机辅助数据输入2、光电输入,48,1、计算机辅助数据输入,计算机辅助系统转换主要用在电话访问中,也就是采用“计算机辅助电话调查系统”收集资料时,通过计算机和转化软件可以直接将调查员在电话访问过程中输入电脑中的数据转化为数据文件。,49,2、光电输入,光电输入包括光电扫描和条形码判读两种方式。光电扫描是指将登陆到专门的光电扫描纸上的编好码的数据,用扫描仪器扫描到计算机中。,50,2、光电输入,条形码判读是指利用条形码判读器将问卷上与答案编码相对应的条形
15、码直接扫描到计算机中。使用这种方法需要先将与问题的每一个答案相对应的编码设置成条形码,在印刷问卷的时候,一起印在问卷上。,51,2、光电输入,输入数据时,先编写相应的输入程序,然后再将选中的答案的条形码逐一扫描进计算机即可。,52,第四节 数据清理,一、有效范围清理二、逻辑一致性清理三、数据质量抽查,53,一、有效范围清理,有效范围清理的逻辑是:问卷中任何一个变量,其有效编码值往往都有某种范围,而当数据中的数字超出这一范围时,可以肯定这个数字一定是错误的。,54,一、有效范围清理,产生这种错误的原因,主要是因为:1、原始问卷中的答案出现了问题。2、错误发生在编码员的编码上。3、错误发生在计算机
16、输入人员输入数据的过程中。,55,二、逻辑一致性清理,逻辑一致性清理的基本思路是:依据问卷中的问题相互之间存在的某种逻辑联系,来检查前后数据之间的合理性。,56,三、数据质量抽查,数据质量抽查是从样本的全部个案中,抽取一部分个案,对这些个案参照原始问卷逐一进行校对。用这一部分个案校对的结果,来估计和评价全部数据的质量。根据样本中个案数目的多少,以及每份问卷中变量数和总数据的多少,研究者往往抽取2%-5%的个案进行校对。,57,第五节 数据汇总,所谓汇总,就是根据研究的目的,对分类后的各种数据进行计算和加总,汇集到有关的表格之中,以集中系统地反映调查资料总体内部的数量情况。,58,第五节 数据汇
17、总,汇总的目的是:(1)初步了解数据的分布情况;(2)为编制次数分布表做准备;(3)为深入的统计分析做准备;(4)便于保存调查资料。,59,第五节 数据汇总,汇总的结果通常是用汇总表的形式给出。制作汇总表时,一般地应将封闭型问题放在汇总表的左侧,然后是半封闭性问题,最右侧是开放性问题。,60,第五节 数据汇总,一、记录排序二、行列转置三、数据格式转变四、文件合并五、数据汇总六、记录拆分七、记录筛选八、记录加权九、Data菜单中的其他命令十、生成新变量十一、对变量值重新编码,61,一、记录排序,选Data菜单的Sort Cases命令项,弹出对话框,在变量名列框中选一个需要按其大小排序的变量,点
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 调查 资料 统计 处理 显示
链接地址:https://www.31ppt.com/p-6609898.html