欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    第问卷数据的录入与清理.ppt

    • 资源ID:5160630       资源大小:310.02KB        全文页数:30页
    • 资源格式: PPT        下载积分:10金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要10金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    第问卷数据的录入与清理.ppt

    统计数据分析基础教程基于SPSS和Excel的调查数据分析,第3章问卷数据的录入与清理,本章内容,3.1 问卷数据的录入3.2 在Excel中录入数据3.3 核对和清理数据3.4 在Excel中核对数据3.5 在SPSS中录入数据3.6 在SPSS中核对数据附录 Excel数据分析工具附录 在Excel中生成随机数,问卷数据的录入与清理,进行数据统计分析之前,必须先将问卷数据录入计算机。为了保证不“GIGO,Garbage In Garbage Out”(垃圾进垃圾出),在统计分析之前,需要对录入的数据进行核对和清理。,3.1 问卷数据的录入,数据输入就是将问卷数据所对应的编码通过扫描或用键盘输入计算机,建立数据文件的过程。目前,数据输入的方式主要有三种:人工输入计算机辅助系统转换光电输入,3.1问卷数据的录入(人工输入),人工输入的注意事项:要规定统一的输入内容和输入格式。挑选和培训数据输入人员。数据输入过程中需要注意:第一,统一规定数据文件名。第二,数据输入时要为每一个输入人员提供一份有关输入内容和格式的手册。第三,要为每个输入人员提供足够的空间摆放问卷,避免不同输入人员的问卷或者同一输入人员已输入和未输入的问卷发生混淆,造成漏输或重复输入,影响问卷的质量。第四,每个输入人员在完成各自负责的问卷的输入任务后,由研究者把他们的数据合并成一个总的数据文件,以供统计分析使用。为了避免数据丢失,要把每个输入人员输入的数据单独存档,以备查找。,3.2 在Excel中录入数据(单选题),1确定取得单一答案2尽可能使用单选题3单选题如何编码和输入Q1.请问您现在是否拥有手机?1.有2.没有(跳至Q12题)例3-1 在Excel中录入单选题Q1的数据单选题的编码和输入(用文字当列名,图3-1)单选题的编码和输入(用题号当列名,图3-2),3.2 在Excel中录入数据(单选题),例3-1 在Excel中录入单选题Q1的数据单选题的编码和输入(用文字当列名,图3-1)单选题的编码和输入(用题号当列名,图3-2),3.2 在Excel中录入数据(多选题),多选题分为多项限选题、多项排序题、多项任选题。Q2.请问您当初购买手机的原因是什么?(可多选,最多3项)1.方便与家人联络 2.方便与朋友同学联络 3.追求流行4.工作需要 5.同学间比较的心理 6.别人赠送7.手机价格下降 8.厂商推出的促销方案 9.网内互打较便宜 10.其他例3-2 在Excel中录入多选题Q2的数据多选题的编码有2种:分类法和二分法。“分类法”编码和输入(图3-3)“二分法”编码和输入有关“分类法”和“二分法”编码,请参见P7274冻结窗格(比较图3-4和图3-5),3.2 在Excel中录入数据(多选题),例3-2 在Excel中录入多选题Q2的数据“分类法”编码和输入(图3-3),3.2 在Excel中录入数据(多选题),例3-2 在Excel中录入多选题Q2的数据冻结窗格(比较图3-4和图3-5),3.2 在Excel中录入数据(填空题),填空题也称开放题,不提示任何答案,要求使用者直接填写。对数值型的数据,为了取得其真正的数字(如:55),而非只取得区间(如:4160),会采用填空题的方式取得数据(定量数据,数值型数据),例如:请问您平均每个月手机的话费约 元?定量数据可不经任何转换,即可计算各种统计量:均值、标准差、最大值、最小值等,而且也可以直接进行均值比较与检验,甚至可以作为回归分析的因变量或自变量。如果为了取得数据的方便,就设计成选择题(单选题):请问您平均每个月手机的话费约多少钱?1.20元及以下2.2140元3.4160元 4.6180元5.81100元6.101元及以上例3-3 在Excel中录入填空题的数据(图3-6),3.2 在Excel中录入数据(填空题),例3-3 在Excel中录入填空题的数据(图3-6),3.2 在Excel中录入数据(量表),量表其实是一种顺序尺度(有序变量),只有大小先后的关系,无倍数关系。量表有多种编码方式,如P60的表3-2是量表常用的三种编码方式。例3-4 在Excel中录入量表的数据(图3-7),补充:输入数据时,对于量表编码,要取得同向,如P34的例2-26,反向题要正向编码后再输入,3.2 在Excel中录入数据(量表),例3-4 在Excel中录入量表的数据(图3-7),3.2 在Excel中录入数据(排名题),排名(多项排序)是一种衡量的方式。如:下列几种手机的入网方式,请问您认为哪一种的收费最便宜?请依排名顺序,填入1、2、3、4、5:全球通 神州行 如意通 动感地带 新时空 分此种类型的问卷,作为被排名的对象也不宜太多。否则,受访者也无法排列好。排个5、6项基本就是上限了。例3-5 在Excel中录入排名题的数据(图3-8)可将排名题改为单选题,3.2 在Excel中录入数据(排名题),例3-5 在Excel中录入排名题的数据(图3-8),3.3 核对和清理数据,数据有效范围的清理对数据中的奇异值进行清理。数据逻辑一致性的清理依据问卷中的问题相互之间所存在的某种内在的逻辑联系,来检查前后数据之间的合理性,主要针对的是相倚问题和多项限选题。数据质量的抽查,个案(Case):一份问卷的数据在计算机中的编码值,占一行,3.4 在Excel中核对数据,筛选出范围不合理的单列例3-6 在Excel中核对“大小适中”的数据用自动筛选找出不合理的关联题例3-7 在Excel中核对关联题“是否有手机”与“平均月费”的数据用高级筛选找出重复的记录例3-8 用Excel处理重复的记录,3.4 在Excel中核对数据,筛选出范围不合理的单列例3-6 在Excel中核对“大小适中”的数据,3.4 在Excel中核对数据,用自动筛选找出不合理的关联题例3-7 在Excel中核对关联题“是否有手机”与“平均月费”的数据,没有手机但有手机话费,有手机但没有手机话费,3.4 在Excel中核对数据,用高级筛选找出重复的记录例3-8 用Excel处理重复的记录,3.5 在SPSS中录入数据,手工建立数据文件例3-9 在SPSS中,手工建立调查问卷的数据文件1.调查问卷(P6869)2.确定变量的个数3.在SPSS中定义变量4.单选题的变量定义5.多选题的变量定义:二分法和分类法 从Excel获取数据文件例3-10 将Excel中的数据导入到SPSS数据文件中方法一:先在SPSS中定义好变量,然后通过“复制粘贴”方式将数据从Excel复制到SPSS中。方法二:利用打开数据文件的方法直接把Excel中的数据导入到SPSS中,然后再定义变量属性。,3.5 在SPSS中录入数据,多选题的变量定义:二分法和分类法 二分法(Multiple Dichotomies Method):将每个可能的答案设为一个变量,变量的取值最多有两个(1和0),分别表示“选”或“不选”(在实际应用中,经常只有一个取值1,表示“选”,而用空值表示“不选”)。这种方法的缺点是需要的变量个数比较多;优点是比较简单。二分法常用于“不限选”和“限选不排名”。分类法(Multiple Category Method):分类法常用于“限选”(很少用于“不限选”),包括“限选不排名”和“限选排名”。按照限选的最多答案设置变量个数,每个变量的取值为选项值。比如,一个多选题,如果最多可选3个答案,那就设置3个变量,分别用来存放3个可能的答案。如果某受访者只填答两个,那么第3个变量的取值为缺失值;如果某受访者只填答一个,那么第2、3个变量的取值均为缺失值。分类法的优点是需要的变量个数比较少。,补充:限选不排序多选题的两种编码三种组合方式,以问题5(Q5)限选不排序多选题为例方式1:二分法编码:P73的表3-5(4个变量,编码为1)方式2:分类法编码:P73的表3-6(2个变量,编码为1、2、3、4)补充方式3:变量个数采用二分法(4个变量),编码采用分类法(1、2、3、4),具体如下:,建议:应用案例实验1,如果限选不排序多选题的选项超过了2项(如:可多选,最多3项),建议采用方式3,这样的好处是核对容易。请参见“补充:多选题两种编码和核对.xls”,实际应用中,建议采用方式2。因为一般只核对单列数据有效范围,很少核对逻辑一致性,改错:P74的表39改为,由于采用“分类法”编码,所以在SPSS中的Values也应该是分类法编码,而不是简单的“选”或空白。修改的目的:在用SPSS进行多选变量的频率分析时(具体见第六章),SPSS的输出结果可读性好。,3.5 在SPSS中录入数据,从Excel获取数据文件例3-10 将Excel中的数据导入到SPSS数据文件中方法一:先在SPSS中定义好变量,然后通过“复制粘贴”方式将数据从Excel复制到SPSS中。方法二:利用打开数据文件的方法直接把Excel中的数据导入到SPSS中,然后再定义变量属性。具体如下:在SPSS中,单击菜单“File”-“Open”-“Data”,进入“Open File”对话框,在最下面的“文件类型”框中选择“Excel(*.xls)”,然后选择录入好数据的Excel文件(要求该文件暂时没有被Excel打开),单击“打开”,进入“Opening Excel Data Source”对话框,单击“OK”。定义变量属性:对每个变量进行进一步的定义(如变量名标签、变量值标签等),以期达到SPSS分析所要求的目的,3.6 在SPSS中核对数据,利用SPSS的一维频率分析Frequencies命令可以发现单变量范围不合理的数据。利用SPSS的交叉表分析Crosstabs命令可以发现两个变量之间的逻辑一致性问题。,实践题,1999年关于外商投资企业雇员调查问卷(P8081)要求:(1)确定问卷中每个问题应该设置的变量的个数,并区分是定性(分类)变量还是定量(数值型)变量。(2)给每个变量定义变量名、数据类型、变量名标签。(3)对于定性(分类)变量,定义相应的变量值标签(类别编码含义)。(4)自己填写一份问卷,并把有关信息输入数据文件中。(5)利用Excel随机数发生器,按照问题的编码,随机生成900份问卷数据,并对生成的数据进行核对。(6)保存这901份问卷的数据。,请参见实验3.4,随机数生成方法请参见实验3.1实验3.2,附录 Excel数据分析工具,1.Excel数据分析工具及其安装(1)工作表函数与数据分析工具的区别(2)数据分析工具的安装(两种方法)方法二有2个要求Excel软件的菜单“工具”“宏”“安全性”为“中”;Analysis文件夹下的5个文件都要有2.统计分析工具的内容3.统计分析工具的使用,更详细的安装步骤请参见Analysis文件夹下的“Excel数据分析工具的安装说明.doc”,附录 在Excel中生成随机数,1在Excel中生成序号2在Excel中生成随机数利用“数据分析”工具“离散”分布“柏(伯)努利”分布 利用RANDBETWEEN随机整数函数由于每次计算工作表时都将返回一个新的数值,所以最好能够将其产生的随机整数保存不变,具体做法是先“复制”再在原处“粘贴”为“值”。,变量个数(m):表示要产生m列随机数个数(n):表示要产生n行一共产生n行m列的随机数,

    注意事项

    本文(第问卷数据的录入与清理.ppt)为本站会员(sccc)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开