《资料整理》PPT课件.ppt
,资料收集与整理,第八章,第九章 资料整理,资料收集,资料收集是通过对社会现象的观察、量度与探究来获取社会信息的过程。资料收集的方法:问卷法量表与测验法访问法观察法文献法实验法,第九章 资料整理,资料整理,资料整理就是对收集到的原始资料进行检查、分类和简化,使之系统化、条理化,以为进一步分析提供条件的过程。资料的审查编码录入数据清理统计表与统计图,第九章 资料整理,一、资料的审查,真实性,即看资料是否真实可靠地反映了调查对象的客观情况。准确性,即看资料是否按照统一要求回答填写。完整性,包括两个方面的内容:一是资料总体的完整性,如回收率;二是每份资料的完整性。其他:比如提供资料者的身份是否符合所规定的调查对象的身份;等等。,第九章 资料整理,二、资料的编码,编码就是将文字资料转化为数字形式的过程,当然也可使用阿拉伯数字之外的其他符号来编码,如英文字母等。编码分为两步,第一步是对回答进行分类,第二步是建立回答类别与变量数值间的对应关系。,第九章 资料整理,资料编码的方法,预编码:是在设计问卷时对回答的每一个种类都制定好其编码值,并印在问卷上。限于回答类别事先已知的问题。后编码:多用于开放性问题的编码。边缘编码:不仅指定了编码值,而且给出了每个项目记录回答(编码)的空间。在问卷上每个调查项目旁边的空白处标明填写编码的位置。问卷回收后,将每份问卷上的回答变成指定位置上的编码。,第九章 资料整理,上海市民生活方式问题调查表,1 您的性别:1.1(1)男(2)女2 您的年龄:2.3(1)18-25周岁(2)26-35周岁(3)36-45周岁(4)46-60周岁(5)61周岁以上3 您的文化程度:3.6(1)小学以下(2)小学(3)初中(4)高中或技校(5)中专(6)大专(7)大学本科以上,第九章 资料整理,特殊说明,任何调查中都不免有一些回答者对一个问题不做任何回答的情况,为此对问卷中的每个提问要增加一个无回答编码。通常的习惯是用9或几个9来代表无回答。当9是真实回答时,须改用其它不可能出现的数字作编码。对于专门的社会调查,除对问卷或调查表中的所有问题进行编码外,还应对每一份问卷中包括的下述项目进行编码:问卷编号、问卷所属区域或部门、其他要进行统计的分类标准。,第九章 资料整理,编码手册,在编码手册中,研究者要将需要编码的项目和问题一一列出,逐一规定它们的代码、宽度、栏码、简要名称、答案赋值方式及其它特殊规定等。整个手册的格式要规范统一,指示要明确,且容易理解,便于操作。,第九章 资料整理,编码手册,第九章 资料整理,数据片断,第九章 资料整理,特殊题型的编码,复选题的编码:编码成为K个变量,即题目中的每一个答案选项,都被设定为一个(0-1)新的二分复选变量;如果该答案选项没有被选中,则复选变量取值为0,被选中则取值为1。例:8、您一般通过下列哪些渠道搜集就业信息?(可选多项)1 就业广告 2 职业介绍所 3 招工单位4 政府劳动部门 5 其他各类组织6 各类社会关系 7 其他(请说明),第九章 资料整理,编码手册示例,第九章 资料整理,复选题分析描述统计结果,第九章 资料整理,排序题的编码,例:请在下列各种提供就业信息渠道的选项中,选出三种您最常使用的,并依程度标出1、2、3的次序。1 就业广告 2 职业介绍所 3 招工单位4 政府劳动部门 5 其他各类组织6 各类社会关系 7 其他(请说明),第九章 资料整理,编码手册示例,第九章 资料整理,三、资料的录入,数据录入的方式主要有两种:一种是直接从问卷上将编好码的数据输入计算机;另一种是先将问卷上编好码的数据转录到专门的登录表上,然后再从登录表上将数据输入计算机。,第九章 资料整理,资料的录入,研究者必须对数据的输入工作进行精心组织和安排。挑选和培训输入人员。统一规定数据输入格式和数据文件名。每个输入人员独立完成各自所输的那一部分问卷。在每个输入人员完成各自所负责的问卷输入任务后,由研究者把他们的数据合起来形成一个总的数据文件,以供统计分析时调用。,第九章 资料整理,四、数据清理,1、有效范围清理。错误数字的出现可以发生在资料处理的每一个阶段。首先,它可以发生在原始问卷中的回答上(回答者);其次,它可以发生在编码员对问卷的编码结果上(编码员粗心);第三,它可以发生在计算机录入员输入数据的过程中(录入员)。,第九章 资料整理,第九章 资料整理,有效范围清理例,第九章 资料整理,数据清理,2、逻辑一致性清理基本思路是依据问卷中的问题相互之间所存在的某种内在的逻辑联系,来检查前后数据之间的合理性。3、数据质量抽查采用随机抽样的方法,从样本的全部个案中,抽取一部分个案,进行这种形式的校对工作。用这一部分个案校对的结果,来估计和评价全部数据的质量。根据样本中个案数目的多少,以及每份问卷中变量数和总字符数的多少,研究者往往抽取2%-5%的个案进行校对。,第九章 资料整理,栏目熟悉程度与收视率的交互分析,第九章 资料整理,五、统计表与统计图,(一)统计表的构成与制作统计表的构成:通常都由表号、总标题、横行标题、纵栏标题、数字、注释和资料来源等要素所构成。,第九章 资料整理,统计表,第九章 资料整理,统计表的制作,原则是:科学规范简明实用美观。注意事项:首先,表的标题要简短明了,要能确切说明表中数据的内容,使人一目了然。其次,表的纵栏标题与横行标题要准确反映变量取值的含义,它们的排列顺序也应具有一定的逻辑结构。第三,表中的数据资料必须注明计量单位。第四,对于一般频数分布表,则应列出合计栏,以便获得整体情况的资料。最后,各种表格均应以横线为主,能够不用竖线则尽量不用。即便需要用竖线的表格,也应视开口式的,即表的左右两端不划竖线,表中各栏各行数字必须对齐,以便阅读。除表的最上面一条横线与最下面一条横线用粗线外,其余横线均用细线。,第九章 资料整理,(二)统计图,具有直观、形象、一目了然、通俗易懂的特点,主要用于调查资料初级统计结果的描述,特别适合于对调查总体的内部构成进行描述,对不同现象的分布进行比较以及对现象变化的趋势进行展示等。1、条形图。矩形图,是以宽度相等、长度不等的长条来表示不同的统计数字,如表示频数或百分比的多少等等。2、圆形图。扇形图,是以圆内不同扇形面积的大小来表示总体中不同部分所占的比重,形象地反映总体的内部结构。3、折线图。曲线图,是通过上下变化的线段来反映所研究现象随时间变化的过程和发展趋势的图形。,第九章 资料整理,条形图,第九章 资料整理,圆形图,第九章 资料整理,折线图,