《统计分析软件应用》教学讲义.ppt
《《统计分析软件应用》教学讲义.ppt》由会员分享,可在线阅读,更多相关《《统计分析软件应用》教学讲义.ppt(316页珍藏版)》请在三一办公上搜索。
1、统计分析软件应用,薛薇中国人民大学统计学院2011.2,第一章 SPSS 概述,SPSS概述,SPSS:Statistical Package for Social ScienceStatistical Product and Service SolutionsSPSS的发展:60年代:美国斯坦福大学三位研究生研制70年代:SPSS总部成立于芝加哥,推出SPSSX中小型机版80年代:SPSS公司(SPSS/PC+微机版13)90年代:SPSS公司(SPSS WINDOWS版514),SPSS 主要特点,操作简便。绝大多数操作是通过菜单、按钮、对话框完成的。无需计算机编程、需记忆大量命令和参数。
2、分析方法丰富、分析结果清晰、直观。可以直接读取其他软件格式的数据文件,如:dbf、xls、sas等。最新版本采用分布式分析系统,适应互联网,支持动态收集、分析数据和HTML报告与一般的办公软件直接兼容不方便,SPSS主要窗口:数据编辑窗口,窗口标题:data editor 功能:对SPSS的数据文件进行录入、修改、管理等基本操作的窗口。组成:窗口主菜单、工具栏、数据编辑区、状态显示区特点:SPSS运行过程中自动打开SPSS中各统计分析功能都是针对该窗口中的数据进行的窗口中的数据文件以.sav存于磁盘上两个视图:数据视图和变量视图,SPSS主要窗口:数据输出窗口,窗口标题:viewer功能:SP
3、SS统计分析报表及图形的输出的窗口。组成:窗口主菜单、工具栏、结果显示区、状态显示区特点:在进行第一次分析时自动打开,也可手工打开可以手工打开若干个可相互切换的viewer窗口;状态栏上的!表示当前输出窗口输出窗口可以关闭,窗口内容以.SPO存于磁盘上两个视图:目录视图和内容视图,SPSS主要窗口:数据输出窗口,驾驭数据出输出窗口一般操作结果文件的打开和保存加密保存窗口元素的移动和删除标准的拖放式操作在大纲视图中操作最方便结果的导出以纯文本格式导出、以HTML格式导出如何在WORD中引用分析结果统计表格:拷贝或拷贝对象统计图:拷贝对象,表格的编辑表格状态的确定单元格内容编辑行列转置Autofi
4、t表格样式的变换,SPSS基本运行方式,完全窗口菜单方式:所有分析操作过程都是通过菜单和按钮及对话框方式进行的.是经常使用的一种运行方式,适用于一般分析和SPSS的初学者.,SPSS基本运行方式,程序运行方式:手工编写SPSS命令程序一次性提交计算机运行适用于大规模的分析工作和熟练的SPSS程序员.实现方法:(1)打开SYNTAX语句窗口并编写和修改SPSS程序(2)点击语句窗口中的RUN菜单项,选择运行方式运行,Syntax语句窗口,窗口标题:syntax editer 功能:编写和修改SPSS程序的窗口.特点:打开:FILE-NEW-SYNTAX或FILE-OPEN-.SPS扩展名窗口中的
5、程序以.SPS存于磁盘上菜单项RUN中提供四种程序执行方式:All、Selection、Current、To end,SPSS 基本运行方式,菜单程序混合运行方式:先通过菜单选择分析过程和参数,不立即提交(OK)执行,而是按动PASTE按钮.计算机自动将用户刚定义的分析过程和参数转换成SPSS的命令,并显示到SYNTAX语句窗口中.用户可对其进行必要的修改后再提交给计算机执行.一般适用于熟练的SPSS程序员.,利用SPSS进行数据分析的步骤,建立SPSS数据文件定义数据文件结构录入修改和编辑待分析数据数据的统计分析统计分析之前的预处理统计分析数据和分析结果的保存结果的说明和解释,思考复习,SP
6、SS有哪两个主要窗口?功能是什么?有哪些特点?SPSS有哪些运行方式?特点是什么?,第二章 SPSS数据文件的建立和管理,一份简单的调查问卷,单项选择题提供几个备选择答案,从其中选择一个答案变量类型:分类数据、定序数据数据类型:字符型填空题变量类型:定距数据数据类型:数值型,如何利用SPSS组织数据,SPSS数据文件是一种有结构的数据文件,年级 性别问题1问题n,11.4222.,文件结构,数据,个案case,变量名,变量,用字符或数字表示字符型数据SPSS数据文件一般只能通过SPSS软件打开,一份简单的调查问卷,多项选择题提供几个备选择答案,从其中选择多个答案如:在下列品牌中您信任哪些品牌?
7、被诊断为高血要后你采取了以下哪些辅助治疗手段?如:高考时报考学校(1)北京大学(2)清华大学(3)人民大学(4)北京理工大学(5)北京师范大学(6)北京外国语大学多项选择题不能在SPSS中直接存储,因为SPSS的一个变量只能有一个取值,如何利用SPSS组织数据,多项选择题的处理方法思路:将一个问题定义成几个变量,用这几个变量来描述该问题的几个可能被选择的答案。编码方式:多选项二分法(multiple dichotomize method)多选项分类法(multiple category method),多选项二分法 将每个答案作为一个变量,每个变量只有两个取值(0或1)。例如:,如何利用SPS
8、S组织数据,多选项分类法:预先估计多选项问题可能被选择的最多答案数.为每个答案建立一个变量,取值为多选项问题的可选答案.例如:,如何利用SPSS组织数据,频数数据:,如何利用SPSS组织数据,设置三个变量:专业方向、性别、人数,SPSS数据文件的结构,(一)变量名(Variable name):变量名是变量存取的唯一标志。起名规则:不多于8个字符组成不区分大小写允许汉字作为变量名默认变量名为VARn,如:var00001,SPSS数据文件的结构,(二)变量的类型(type)和显示宽度(width)1、数值型:标准数值型(Numeric):默认类型 8.2如:12345678、12345.67、
9、-1234.56 带逗号的数值型(Comma):从个位开始三位一个逗号8.2如:1,234.56科学计数法(Scientific Notation):表示很大或很小的数据 8.2如:1.2E+05带美元符号(Dollar):表示货币格式很多,如:$12.30,SPSS数据文件的结构,2、字符型(String):存储字符数据 8位如:beijing 处理时用双引号扩起来3、日期型(Date):存储日期数据 格式很多,如:20-AUG-19994、其他:如:圆点数值型(dot)、用户自定义型(customer)注意:显示宽度不影响数据的存储,SPSS数据文件的结构,(三)变量名标签(Variabl
10、e label):对变量名的一些解释说明,增强分析结果的可视性。可以省略。(四)变量值标签(Value label)对变量所取值的一些解释说明,增强分析结果的可视性。可以省略。一般用于品质数据 如:1-男 2-女、1-高 2-中 3-低,SPSS数据文件的结构,(五)变量列格式(Column Format)对齐方式(Text Alignment)左对齐(Left):字符型默认。右对齐(Right):数值型默认。居中对齐(Center)列宽度(Column Width)默认值为变量的总长度。,SPSS数据文件的结构,(六)缺失值(Missing Values)1、什么是缺失值?漏填数据明显错误的
11、数据2、对缺失值的一般处理事先指定:指定某个特定值为缺失值(用户缺失值)其他处理方法,如:以均值、众数替代等3、SPSS缺失值 用户缺失值 系统缺失值:数值型:点()字符型:空,SPSS数据文件的结构,(七)变量计量尺度(Measurement)scale:定距数据,一般为数值型数据。如:收入、人数。ordinal:有固有顺序的顺序水准的数值型或字符型数据。如:职称、年龄段nominal:无固有顺序的名义水准的数值型或字符型数据。如:性别、民族,定义SPSS数据文件结构,操作方法:利用变量视图如何查看变量定义的情况 菜单选项:Utilities-Variables,SPSS数据的录入与保存,录
12、入时应注意:黑框确定当前数据单元录入带有变量值标签的数据:手工输入代码,屏幕显示变量值标签冻结第一列数据保存:操作保存格式:(1)*.sav:SPSS数据文件(默认)。(2)*.dbf:dbase数据文件。(3)*.xls:Excel工作表文件。注意:有些信息会丢失,SPSS数据的编辑,(一)打开数据文件菜单选项:File-Open-.sav(二)数据定位按个案号码定位菜单:Data-Go to case-输入样本号按值定位光标定位到某列变量上-Edit-Find.,SPSS数据的编辑,(三)插入和删除一个个案插入:data-insert case删除:选定待删行,鼠标右键找到Cut(四)插入
13、和删除一个变量插入:光标定位到某列变量上-Data-Insert Variable(插到某列前)或鼠标右键删除:选定列,鼠标右键Cut项,SPSS数据的编辑,(五)数据移动、复制和删除定义源数据块鼠标右键:cut copy clear确定目标单元鼠标右键:paste,数据文件的合并,目的:将两个SPSS数据文件合并到一个数据文件中文件合并的方式:纵向合并横向合并,(一)纵向数据合并(1)含义:将磁盘上的一个SPSS数据文件追加到当前data editor窗口中的数据文件中。(2)前提:两个SPSS数据文件应可以合并的内容,且最好有相同的变量名和变量类型。(3)菜单选项:data-merge f
14、ile-add cases,数据文件的合并,数据文件的合并,(二)横向数据合并(1)含义:将磁盘上的一个SPSS数据文件中的若干个变量增加到当前data editor窗口的数据文件中。(2)前提:a.两个数据文件必须有一个共同的变量名为关键字段-合并的依据;b.两个数据文件应事先按关键字段升序排序。,数据文件的合并,(二)横向数据合并(3)菜单选项:data-merge file-add variable(4)选项说明:math cases on key variables in sorted files:以关键字作为合并标志。Both files provide cases:合并后的文件的数
15、据由两个文件共同提供。External file is keyed table:以data editor的数据为基础。Working data file is keyed table:以磁盘文件的数据为基础。,与其他软件数据共享,共享dbf和xls格式文件菜单选项:Data-Open(1)*.dbf:dbase数据文件。字段名、字段类型自动转成SPSS数据文件中的变量名和类型。一条记录为一个个案。(2)*.xls:Excel文件(Read variable name选项)共享数据库文件建立ODBC数据源,第三章 SPSS数据文件的基本加工和处理,SPSS数据文件的基本加工和处理,数据文件的整理
16、 个案排序、个案选取数据加工 变量计算、计数数据分组 自动分组、手工分组数据文件的其他处理功能 指定加权变量,目的:将所有个案按照用户指定的某一个或多个变量的变量值的升序或降序重新排列。菜单选项:data-sort cases注意:(1)Ascending:升序、Descending:降序。(2)多重排序,选择变量名的次序很关键。,个案排序,排序在数据分析中的作用?,个案选取,目的:从现有数据中挑选出部分数据。菜单选项:data-select cases选取个案的几种不同方式(1)选择符合一定条件的个案(If condition is satisfied)(2)随机选取个案(Random sa
17、mple of cases)近似选取、精确选取(3)选取某一区域内的个案(Based on time or case range)(4)使用过滤变量(use filter variable)注意:以后的操作和分析都在该个案选取的基础上进行.,个案选取在数据分析中的作用?,变量计算,目的:产生新变量或对原变量进行必要的转换处理(如:预测问题 产生比率数据 偏态数据的正态处理 时间序列的平稳处理等)(1)含义:根据用户给出的SPSS算术表达式,对所有或部分样本数据进行加工。(2)菜单选项:transform-compute if 按钮(3)SPSS算术表达式(Numeric Expression)
18、:由算术运算符(+、-、*、/、*)、SPSS函数以及SPSS变量名组成的式子。,变量计算,算术函数统计函数分布函数逻辑函数字符串函数缺失值函数日期时间函数其他函数,(4)SPSS函数,算术函数Abs():求绝对值sqrt():求平方根rnd():四舍五入后取整trunc():截取小数部分取整mod():取余Ln():自然对数Lg10():以10为底的对数,(4)SPSS函数,变量计算,统计函数:mean():均值sd():标准差sum():求总和cfvar():求变异系数max()min():求最大最小值,(4)SPSS函数,变量计算,分布函数:normal():产生服从标准正态分布的随机数
19、序列uniform():产生均匀分布的随机数序列rv.():产生指定分布的随机数序列,如:rv.t(10)cdf.():计算指定分布的累计概率值idf.():计算指定分布的临界值,(4)SPSS函数,变量计算,逻辑函数:range():判断变量值是否在指定的区间内any():判断变量值是否为指定的若干值字符串函数:index(S1,S2):判断字符串S2在S1中首次出现的位置length():求字符串长度lower()upcase():字符串的大小写转换lpad():用指定字符补齐字符串为指定长度ltrim():压缩字符串空格substr():取子串,(4)SPSS函数,变量计算,缺失值函数m
20、issing():判断变量是否取系统或用户缺失值sysmis():判断变量是否取系统缺失值其他函数:Lag():便于进行差分计算,(4)SPSS函数,变量计算,变量转换,(5)SPSS条件表达式:条件表达式:由SPSS关系运算符、逻辑运算符、SPSS函数以及SPSS变量名组成的式子。关系运算符:(大于)、=(大于等于)、32、sr=700,逻辑运算符:&(AND):并且|(OR):或者(NOT):非 如:(nl32)and(sr700)not xb=1,计数,(1)含义:对所有或部分个案,计算若干个变量中有几个变量的值落在指定的区域内,并将结果存入新变量中。(2)菜单选项:transform-
21、count-define value,产生计数变量,(3)指定区域的定义Value:指定一个值system-missing:系统缺失值system-or user missing:系统或用户缺失值range through:指定一个闭区域,给出最大和最小值range:lowest through n:最小值到某个给定值range:n through highest:某个给定值到最大值,数据文件的分类汇总,(1)含义:按指定的分类变量的变量值对个案分组;计算每组个案的汇总变量的基本统计量;将计算结果生成到一新文件中,即:在新文件中对应分类变量的每一个分类值产生一个个案。,原始数据,按性别变量汇总
22、数据,数据文件的分类汇总,(2)菜单选项:data-aggregate(3)说明:多重分组时,变量名的选择顺序。生成的新文件名默认为:aggr.sav。可修改。生成的新变量名默认为原变量名后加_1。可修改。可以在新文件中存贮个分组个案数.,数据分组,目的:了解数据的总体分布状况思路:指定按哪个变量分组,即:指定分组变量定义分组变量的分组区间(不重、不漏)指定一个存放分组结果的标志变量分组方法:自动分组手工分组,数据分组,(一)自动分组单变量值分组(1)含义:分组变量值相同的个案分在同一组,同组中的标志变量相同。标志变量依照分组变量值的大小次序给定。(单变量分组,通常只适合于离散变量且变量值较少
23、的情况)(2)菜单选项:transform-automatic recode分位值自动分组(1)含义:将定距型变量按分位数要求自动划分成相应类(2)菜单选项:transform-categorize variables,数据分组,(二)手工分组(组距分组)(1)含义:人工定义分组区域,对所有个案或符合一定条件的个案进行等距或非等距分组。(2)方法:分组结果存入原变量、分组结果存入新变量,数据分组,(3)分组结果存入原变量:定义分组区域:定义某一区间的原变量值分组后所对应的新值是什么.未定义的原变量值保持不变。菜单选项:transform-recode-into same variables说明
24、:可以指定对符合一定条件的个案进行分组。,数据分组,(4)分组结果存入新变量:定义分组区域:定义某一区间的原变量值分组后所对应的新值是什么.未定义的原变量值在新变量中为系统缺失值。菜单选项:transform-recode-into different variables定义原变量分组后产生的相应新变量(CHANGE钮)可以指定对符合一定条件的个案进行分组。单值区间可以实现数据转换(问卷分析中的反向题重新计分),问卷分析中的反向题重新计分举例,性格打分(内向、一般、外向)1、与生人交往会“自来熟”(1)从不(2)偶尔(3)有时(4)经常 2、与不熟悉的异性交往,会脸红(1)从不(2)偶尔(3)
25、有时(4)经常3、在公众场合下你会大声发表自己的意见(1)从不(2)偶尔(3)有时(4)经常极为内向:3分 较为内向:6分 较为外向:9分 极为外向:12分,指定加权变量,(1)含义:指定某一变量为加权变量。如:平均蔬菜价格、男足打分(2)菜单选项:data-weight case(3)说明 如果取消加权变量应重新定义:data-weight casedo not weight cases,作业,根据给定的两个关于学生成绩的SPSS数据文件做如下处理:合并两个数据文件(数据不一定是一一对应的)计算每个同学的总成绩、平均成绩、标准差计算每个同学的得优率和得良率根据得优率排名将各门课程的成绩按优、
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计分析软件应用 统计分析 软件 应用 教学 讲义
链接地址:https://www.31ppt.com/p-5029520.html