欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    SPSS的数据采集和整理.ppt

    • 资源ID:6520437       资源大小:311.49KB        全文页数:44页
    • 资源格式: PPT        下载积分:15金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要15金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    SPSS的数据采集和整理.ppt

    SPSS的数据采集和整理,本讲主要内容:SPSS数据采集数据格式与问卷题目类型数据录入数据获取SPSS数据整理变量级数据整理文件级数据整理,数据类型,SPSS统计分析要求的数据格式,问题的类型,单选题-3,5字符串型开放题-2数字型开放题-1,4,7多选题-6,问卷示例:1、调查序号。2、您的姓名。3、性别。1)男 2)女4、您的出生年月日。5、您的职业。1)工人 2)农民 3)教师 4)其他6、获取新闻的主要方式有。1)报纸 2)杂志 3)电视 4)收音机 5)网络7、每天收看新闻的小时数。,Back,数据的录入,数据编辑器包括两个视图:1.变量视图:定义变量10个属性2.数据视图:录入数据,定义变量属性-变量名,变量名命名要求:变量名的第一个字符必须为字母,后面可跟任意字母、数字、句点或、#或$等符号;变量名不能以句点结尾;最后一个字符可以为下划线但应避免(可能会与分析过程中自动产生的变量造成冲突);,12版之前变量名的长度一般不能超过8个字符;空格和特殊字符(如!、-、?、和*等)不能用于变量名;每个变量名必须保证是唯一的,不区分大小写;下面的关键词不能用作变量名:ALL NE EQ TO LE LT GE BY OR GT AND NOT WITH,定义变量属性-变量类型type,数字型数值型(Numeric):是默认的形式逗号型(Comma):小数点前数据每三位数用逗点分开小数点型(Dot):小数点前数据每三位数用句点分开科学计数型(Scientific notation)美元型(Dollar),定制货币型(Custom currency):SPSS只提供美元型变量作为现成的货币描述量。若为人民币型变量则必须进行定义。方法如下:进入data editor窗口-edit-option-currency-在prefix选项中输入¥等即可 一次可定义5个不同的货币类型。日期格式型(Date)字符串型(String),定义变量属性-变量标签label,变量标签:对变量的含义解释,定义变量属性-值标签value,值标签:对变量值进行说明。例如对性别变量标注值标签:1=男 2=女(若变量为数值型)或:m=男 f=女(若变量为字符串型),定义变量属性-测量尺度measure,变量测量尺度:定类变量(Nominal):名义变量定(/有)序变量(Ordinal):有序变量定距和定比变量(Scale):尺度变量,定义变量属性-缺失值missing,定义缺失值的类型:没有缺失值:默认方式定义离散缺失值定义连续范围内的缺失值和离散缺失值,Back,录入数据-开放题的录入,数据录入时每行对应一个记录(case)、每列对应一个变量。开放题的录入:1、序号 2、姓名 3、出生年月日 mm/dd/YYYY,录入数据-单选题的录入,不含其它单选题,如:性别。1)男 2)女数据录入三种方式:字符字符加值标签数值加值标签。便于后续分析,推荐采用。,含其它单选题,如:您的职业。1)工人 2)农民 3)教师 4)其他可通过设置两个变量来处理,第一个变量为单选题,若选择“其他”的纪录,则通过第二个开放型变量进行说明。,录入数据-多选题的录入,如:您通常获取新闻方式有。1)报纸 2)杂志 3)电视 4)收音机 5)网络 case 1:杂志、网络 case 2:报纸、电视、收音机,多选题两种录入方法多重二分法(multiple dichotomy method):每个选项作为一个只有两个取值(选为1、未选为0)的变量。该方法会出现很多数据为0的现象,录入数据工作量大。,多重分类法(multiple category method):选项最多的记录有几个选项就设置几个变量。设上题最多有四种获取新闻的方式,在变量视图中:,在数据视图中:,适用于:选项较多、可用于需要排序的回答、常出现数据缺失的情况。多选题变量集的定义:Multiple response(多重响应)菜单:Table 模块,Back,数据的获取,用SPSS可获取的数据:读取SPSS格式的数据 读取Excel等格式的数据 读取文本数据(“分隔”和“固定宽度”)读取数据库格式数据(1)配置ODBC(2)在SPSS中通过ODBC和数据库进行连接,并读取数据,数据的获取-读取EXCEL数据,将数据文件个人工资.xls,读入SPSS中,并保存,以备进一步数据整理和分析。注意以下问题:第一行是否是变量名 从哪张工作表(worksheet)中读取数据 读取数据的范围(如 D1:E6),与“复制+粘贴”不同:第一行可自动定义为变量名,软件会自动识别变量的属性。字符串原样再现(若采用“复制+粘贴”方法,则出现缺失值),但视为字符型变量。(注意:excel应用软件关闭,SPSS才能读取数据),数据的获取-读取文本格式数据,如何读取固定宽度的文本格式数据:以文件demo.txt为例。在此例中,我们读入年龄、婚否、收入等变量数据,可以用记事本打开文件进行观察数据排列形式,再在SPSS中读入相关数据。在软件上分六步实现(略)。,数据的获取-读取数据库数据,SPSS通过菜单File-Open-Data可以直接打开16种外部数据文件格式,如文本文件、EXCEL、Lotus、dBase、SAS文件等。,其他数据文件格式,SPSS可以利用通用数据库ODBC接口读取数据。例:通过SPSS读取Access 2000数据库中数据northwind.mdb,把Access数据库中的如下数据表转化为SPSS文件:产品.sav;订单.Sav;订单明细.sav。,方法是:先设置ODBC数据源配置:文件打开数据库新建查询添加数据源选中MS Access Database配置选择 选中northwind.mdb确定(3次)读取数据:File-open database-new query-选中配置好的文件northwind-下一步-将左边数据库拖到右边-下一步-完成,数据的保存,SPSS获得的数据可以保存为:SPSS格式的文件*.sav(最常见)。其他格式文件,如excel、dbase、sas等22种不同格式的文件。,Back,SPSS的数据整理,数据整理包括两个级别的整理:变量级数据整理:对变量进行操作,如计算新变量、变量编码等,这些功能主要集中在transform(转换)菜单上。文件级数据整理:对文件结构进行处理,如文件行列互换、结构变换、文件拆分、合并等。这些功能主要集中在data(数据)菜单上。,变量级数据整理,Compute(计算)Rank Cases(个案排序/编秩)Recode(重新编码)Automatic Recode(自动重新编码)Visual Bander(可视化分段)Count(计数),变量级数据整理-新变量生成(Compute),利用算术符号和函数生成新变量(Compute),举例:销售总额=单价*数量*(1一折扣)(订单明细.sav)平均成绩=(语文成绩+数学成绩+英语成绩)/3(transfer.sav)计算英语成绩高于70分的平均成绩计算上海学生的平均成绩 注意:1)在英文输入状态下输入函数式 2)利用if按钮设定计算条件 3)字符串条件加“”号,如city=上海,姓名-姓+名,对数据雇员.sav利用函数concat(姓氏,名字)生成新变量“姓名”,注意:1)在变量视图中调整姓氏和名字变量宽度(4位);2)生成新变量的种类改为字符串型。,变量级数据整理-新变量生成(Rank),Rank Cases(编秩)就是对记录按某个变量排序,并生成代表名次的新变量“R+原变量名”,举例:transfer.sav按英语成绩排名,分数最高的为第一名。注意以下问题:相同分数(ties)的名次处理:同小、同中、同大、不间断若按多个变量排序,只能按相同的升降方向排序,Date菜单中的Sort Cases过程也可对数据进行排序,Rank与Sort不同在于:Sort不会生成反映排名序列号的新变量Sort对多个变量排序时可采用升序、降序、混合序例1:个人工资模拟数据.xls,请按工资对个人排序,最高的放在第一行。如果两个人的工资相同,男性排在前。例2:个人工资模拟数据.xls,请在性别内按工资对个人进行降序排列。,变量级数据整理-新变量生成(Recode),将数值型变量转换为字符型,例:将成绩60-100分-记为及格 0-59分-记为不及格将字符型变量转换为数值型,例:及格-记为1 不及格-记为2将几个小类别合为一个类别。例:“A”+“B”-“优良”,“C”+“D”-“中等”“E”-“差”,变量级数据整理-新变量生成(visual bander),Recode过程可进行准确分组,visual bander 过程可进行有规律分组,如:等组距分组。例:按成绩分组90100为A,8090为B,70 80为C,60 70为D,60以下为E等比例分组 例:A级人数占总人数的25%B级占25%C级占25%,D级占25%按平均数和标准差作分割点,Back,文件级数据整理,Merge file(合并文件)Split file(记录拆分)Select cases(记录筛选)Weight cases(记录加权)Aggregate(数据汇总)Transpose(数据转置)Restructure(数据重新构造),文件级数据整理-合并文件(merge file),合并相同变量数据的不同个体-增加记录(sample3.sav,sample4.sav)合并相同个体的不同变量数据-增加变量。注意应先排序(transfer.sav,transfer3.sav)用菜单可以一次合并两个文件,一个是SPSS格式,另一个可以用SPSS直接打开用Syntax可以合并多个文件,文件级数据整理-文件拆分(Split file),例如对文件transfer.sav按学生所在城市拆分四组。便于以后分组分析。拆分状态在窗口右下角显示”split on”,文件级数据整理-记录筛选(Select cases),将符合条件的数据筛选出来进行分析,相当于transform菜单某些功能中的if按钮筛选状态在窗口右下角显示”filter on”,文件级数据整理-记录加权(Weight cases),若各记录出现频数不同,则必须给出加权变量加权状态在窗口右下角显示”weight on”,文件级数据整理-数据分类汇总(aggregate),将记录组合并到单个摘要记录中,并创建新的分类汇总数据文件。基于一个或多个分组变量的值分类汇总记录。新数据文件包含每个组的记录。例如,可按省聚合县数据,并创建一个新的数据文件,其中省是分析单位。以transfer.sav 为例,统计各地语文平均成绩。,文件级数据整理-数据转置(transpose),创建一个新的数据文件,原文件中的行列被转置,使个案(行)成为变量,变量(列)成为个案。转置自动创建新的变量名称,并显示新的变量名称列表。自动创建包含原变量名称 case_lbl 的新字符串变量。,文件级数据整理-数据重新构造(restructure),第一种:一条记录变成多条记录第二种:多条记录变成一条记录第三种:n行*m列变成m行*n列(功能与transpose相同),

    注意事项

    本文(SPSS的数据采集和整理.ppt)为本站会员(牧羊曲112)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开