湘雅卫生统计spss课件.ppt
《湘雅卫生统计spss课件.ppt》由会员分享,可在线阅读,更多相关《湘雅卫生统计spss课件.ppt(228页珍藏版)》请在三一办公上搜索。
1、,SPSS 13.0 for Windows 在医学科研统计中的应用中南大学公共卫生学院卫生统计教研室虞仁和,数据处理的一般原则,医学数据的统计处理涉及到医学专业知识、统计专业知识、处理数据的经验和技巧等各个方面,是一门很高超的艺术。在数据处理过程中,原始数据的采集和录入,数据的管理,恰当选用统计方法,熟练使用统计软件等,都是必须重视的关键环节。,原始数据的记录形式,原始数据的记录形式,原始数据中,变量分为标识变量和分析变量两种。1.标识变量主要用于数据管理,包括数据的核对与增删等,是研究记录中不可缺少的内容,如上表中的“病人编号”和“病案号”即为标识变量。2.分析变量则是数据分析的主要内容,
2、上表中除上述2个标识变量外,其它9个变量均为分析变量。分析变量又被分为反应变量(response variable)和解释变量(explanatory variable)。反应变量是表示试验效应或观察结果大小的变量或指标。解释变量又称指示变量(indicator)、分组变量(grouping variable)、分类变量(categorical variable)、协变量等。根据研究目的以及变量间的相互关系,各变量的作用并非一成不变。,原始数据的录入,在进行统计分析前,原始数据需录入计算机。录入的文件类型大致有:1.数据库文件,如dBASE、FoxBASE、Lotus、EPI info等;Ex
3、cel文件;2.文本文件,如word文件、WPS文件等;3.统计应用软件的相应文件,如SPSS数据文件、SAS数据文件、STATA数 据文件等。目前,上述文件类型绝大多数都可以相互转换。录入数据时,应遵循便于录入,便于核查,便于转换,便于分析的原则。便于录入是指尽可能地减少录入工作量,例如,下图是前表原始数据录入为SPSS数据文件(数据.sav)的形式,录入时,用数值变量取代了字符变量(如图中的“性别”,“肾毒性”,“黄疸”,“昏迷”),可以大大节约录入的时间和费用。(如将性别标记为1=“男”,0=“女”)。,原始数据的录入,数据处理中的几个基本问题,1数据核查 数据录入后,首先须对录入的数据
4、进行核查,以确保录入数据的准确性和真实性。核查准确性可分两步进行。第一步逻辑检查,通过运行统计软件中的基本统计量过程,列出每个变量的最大和最小值,如果某变量的最大或最小值不符合逻辑,则数据有误。例如,在SPSS数据“数据.sav”文件中,当变量“年龄”的最大值为“300”时,一定有误。利用软件的查找功能可立即找到该数据,然后根据该数据对应的标识值找出原始记录,更正该数据。如本例可查到该数据对应的“病人编号”为“27”,查原始记录的年龄为“30”。第二步数据核对,将原始数据与录入的数据一一核对,错者更正。有时,为慎重起见,采用双份录入的方式,然后用程序作一一比较,不一致者一定是录错的数据。数据核
5、查的另一项任务是对数据的真实性做出初步判断。,数据处理中的几个基本问题,2离群数据的处理 当个别数据与群体数据严重偏离时,被称为离群数据(outlier)或极端数据(extreme value)。统计软件一般都有判断离群数据的方法。判断离群数据有多种方法,例如,SPSS软件对其的定义为:观察值距箱式图(box plot)的箱体底线(第25百分位数)或顶线(第75百分位数)的距离为箱体高度(四分位数间距)的1.5倍至3倍时被视为离群点;观察值距箱体底线或顶线的距离超过3倍的箱体高度时被视为极端值。若有离群数据出现,可分为两种情况处理:一种是,如果确认数据有逻辑错误,又无法纠正,可直接删除该数据。
6、例如,若某一数据中某病例的身高变量为“1755”cm,且原始记录亦如此,又无法再找到该病例时,显然这是一个错误的记录,只能删除。另一种是,若数据并无明显的逻辑错误,可将该数据剔除前后各做一次分析,若结果不矛盾,则不剔除;若结果矛盾,并需要剔除,必须给以充分合理的解释,例如用何种方法确定偏离数据,该数据在实验中何种干扰下产生等。,数据处理中的几个基本问题,3统计方法前提条件的检验:应用参数方法进行假设检验往往要求数据满足某些前提条件,如两个独立样本比较t检验或多个独立样本比较的方差分析,均要求方差齐性,因此需要做方差齐性检验。如果要用正态分布法估计参考值范围,首先要检验资料是否服从正态分布。在建
7、立各种多重回归方程时,常需检验变量间的多重共线性和残差分布的正态性。,统计方法选择的基本思路,数据处理中,正确选择统计方法至关重要。选择统计方法可以沿着以下思路进行。第一个层面,看反应变量是单变量、双变量还是多变量。对于前者,第二个层面看属于三种资料类型中的哪一种;第三个层面看单因素还是多因素;第四个层面看单样本、两样本或多样本;第五个层面看是否是配对或配伍设计;第六个层面看是否满足检验方法所需的前提条件。,单变量计量资料的分析,1样本均数与总体均数比较 分析思路为:反应变量为单变量计量资料单因素样本均数与总体均数比较如果服从正态分布,选用样本均数与总体均数比较的t检验(one-sample
8、t-test);如果不服从正态分布,则考虑用非参数检验方法。2两个相关样本均数的比较 分析思路为:反应变量为单变量计量资料单因素两个相关样本均数比较(因为是配对设计)。如果差值服从正态分布,选用配对t检验(paired t-test);如果差值不服从正态分布,选用单样本秩和检验(Wilcoxon one-sample test)。3两个独立样本均数比较 分析思路为:反应变量为单变量计量资料单因素两个独立样本均数比较。如果方差齐性,且两样本均服从正态分布,选用两样本t检验(two-sample t-test);如果方差不齐,但两样本均服从正态分布,选用t检验,或两样本秩和检验(Wilcoxon
9、two-sample test/Mann-Whitney test);如果方差不齐,且两样本不服从正态分布,选用两样本秩和检验。本例选两样本t检验。,单变量计量资料的分析,4多个样本均数比较 应变量为单变量,又属计量资料时,多个样本均数比较分为单因素和多因素两种情形。而重复测量资料则被视为多个反应变量的类型。(1)单因素方差分析:若方差齐性,且各样本均服从正态分布,选单因素方差分析(one-way ANOVA);若方差不齐,或某样本不服从正态分布,选Kruskal-Wallis 秩和检验(Kruskal-Wallis test)。若方差分析或秩和检验结果显著,需进一步做多重比较,如SNK法,L
10、SD法,扩展t检验等。(2)两因素方差分析但不分析交互作用:主要是随机区组设计资料,涉及2个因素,即1个处理因素和1个区组因素。如果满足方差齐性和正态分布两个条件,选用两因素方差分析(two-way ANOVA),如果不满足上述两个条件,选用随机区组设计资料的Friedman秩和检验(Friedman test)。,单变量计量资料的分析,(3)三因素方差分析但不分析交互作用:主要有拉丁方设计和二阶段交叉设计两种资料类型。对于拉丁方设计资料,涉及3个因素,即1个处理因素和2个区组因素;对于二阶段交叉设计资料,3个因素分别为处理因素、受试者和试验阶段。如果满足方差齐性和正态分布两个条件,拉丁方设计
11、可选用三因素方差分析(three-way ANOVA),如例4-5;二阶段交叉设计可选用广义线性模型的方差分析,如例4-6。如果不满足上述两个条件,选用非参数方法(参见有关文献)。若对处理因素的方差分析或秩和检验结果显著,均需进一步做多重比较。,单变量计量资料的分析,(4)多因素方差分析且分析交互作用:此类资料包括析因设计资料(例11-2),正交设计资料(例11-4),嵌套设计资料(例11-6),裂区设计资料(例11-7)等。(5)重复测量资料:单因素重复测量只有1个重复测量因素,如表12-3的数据。多因素重复测量除有1个重复测量因素外,至少还有1个其它处理因素,可分析交互作用,如例12-3。
12、,单变量计数资料的分析,单变量等级资料的分析,若为两组配对等级资料的比较,选Wilcoxon单样本秩和检验;若为两组独立样本等级资料的比较,选Wilcoxon两样本样本秩和检验;若为多组独立样本等级资料的比较,选Kruskal-Wallis秩和检验。,双变量资料的分析,1简单相关分析 分析两变量的相关关系时,若两变量满足二元正态分布,可选Pearson积矩相关分析(Pearson correlation);若两变量不满足二元正态分布,可选Spearman秩相关分析(Spearman correlation)。2线性回归分析 分析两变量的回归关系时,若两变量关系呈线性趋势,可选简单线性回归分析(
13、linear regression)。3曲线回归分析 分析两变量的回归关系时,若两变量关系呈曲线趋势,可按曲线类型选指数曲线,多项式曲线,生长曲线,Logistic曲线等。也可选用非线性回归分析方法。,多变量资料的分析,1有应变量的多元分析 若应变量Y为数值型随机变量,且服从正态分布,自变量满足多元正态分布,可选多元回归分析或多元逐步回归分析 因变量Y为分类变量(二分类或多分类),且以判别分类为主要目的,自变量满足多元正态分布,可选判别分析或逐步判别分析。若因变量Y为生存时间,并含有截尾数据,可选Cox模型做生存分析,若因变量Y为二分类变量或多分类变量,且以分析危险因素为主要目的,如果为配比设
14、计,选条件Logistic回归;如果无配比设计,选非条件Logistic回归。,多变量资料的分析,2.无因变量的多元分析 欲将变量或观察单位划分为性质相近的k类,可选用聚类分析。3.相关分析 若分析1个变量与1组变量的相关关系,可选多重线性相关分析;若分析1组变量与另1组变量的相关关系,可选典型相关分析。,SPSS for Windows 概述,SPSS(Statistics Package for Social Science)社会科学用统计软件包,是目前世界上最优秀统计分析软件之一。随着产品服务领域的扩大和服务深度的增加,其英文全称已于2000年更改为“Statistics Product
15、 and Service Solutions”统计产品与服务解决方案。,SPSS for Windows 概述,SPSS由来自于美国斯坦福大学三位不同专业知识背景的研究生Norman H.Nie,C.Hadlai Hull and Dale H.Bent研发于1968年。1984年SPSS公司推出用于个人电脑的SPSS/PC+,其最初的几个版本是基于DOS环境。SPSS/PC+虽然功能强大,但在用户界面、输入、输出环境等方面并不十分理想。1992年SPSS公司推出Windows版本,即最初的4.0版本。通过对操作平台的升级、数据交换与管理功能的升级、输出结果的升级和统计分析功能的升级,SPSS
16、到现在已经演进到16.0版本。按照约定,凡是DOS环境支持的4.0及其低版本统称为SPSS/PC+;凡是Windows环境支持的5.0及以后版本统称为SPSS。SPSS for Windows是SPSS/PC+的Windows版本。,SPSS for Windows 概述,SPSS与其它国际权威软件相比,虽然也可以通过编辑程序来运行,但他最显著的特点是菜单和对话框操作方式,绝大多数操作过程仅靠点击鼠标即可完成。因而,它以易于操作而成为最受欢迎的统计软件包之一。,SPSS for Windows的特点,1操作简便 SPSS软件基本操作可通过点击鼠标来完成,有一定统计基础且熟悉Windows一般操
17、作的应用者参考它的帮助系统基本上可以自学使用;除了数据录入及部分命令程序等少数输入工作需要使用键盘键入外,对于常见的统计分析方法完全可以通过对“菜单”、“对话框”的操作完成,无需编程。,SPSS for Windows的特点,2数据管理功能强大且操作直观 SPSS软件在其基本界面上集成了数据录入、转换、检索、统计分析、作图、制表及编辑等功能;采用类似EXCEL表格的方式输入与管理数据,数据接口较为通用,能方便的从其他数据库中读入数据。,SPSS for Windows的特点,3统计分析方法比较全面 SPSS 软件的统计过程包括了常用的、较为成熟的统计分析方法,提供了从简单的描述统计到复杂的多因
18、素统计分析方法。比如数据的探索性分析、一般统计描述、简单列联表分析、均数比较、一般线性模型、混合模型、相关回归、对数线性模型、聚类和判别、因子和对应分析、多维标度、信度分析、非参数检验、时间序列、生存分析及缺失值估计等。,SPSS for Windows的特点,4功能模块组合灵活 SPSS 软件由Base、Advance Models、Tables、Trends、Categories、Regression Models、Conjoint、Exact Tests、Missing Value Analysis和Maps等功能模块组成,其中SPSS Base为基本模块,其余为扩展模块,分别用于完成某
19、一方面的统计分析功能。用户可根据自己的分析工作需要和计算机设备的实际配置情况选择和装配模块。,SPSS for Windows的特点,总之,SPSS for Windows界面清晰、形象直观、易学易用。只要掌握一定的Windows操作技能,懂得统计分析基本原理和方法,就可使用该软件为特定的科研服务。,SPSS的启动与退出,(一)SPSS for Windows的启动 1、双击(或单击)程序的桌面快捷方式图标启动SPSS。2、通过“开始”菜单的“程序”运行方式启动SPSS。(二)SPSS for Windows的退出 1、单击主菜单中的“File”,在下拉菜单中单击“Exit”,可退出SPSS。
20、2、单击主菜单右上角控制框中的关闭按扭,可退出SPSS。,主界面(数据编辑窗)简介,一、数据编辑窗,在数据编辑窗中,有标题栏、菜单栏、工具栏、状态栏和数据表视窗及变量表视窗。数据编辑窗主要有建立新的数据文件、编辑和显示已有数据文件等功能。,数据编辑窗组成,数据编辑窗由Data View(数据表视窗)和Variable View(变量表视窗)两个视窗组成,两个视窗切换单独显示。数据表视窗用于显示和编辑变量值;变量表视窗用于定义、显示和编辑变量特征。在SPSS过程中,一次只能打开和显示一个数据文件。,1标题栏,标题栏位于窗口顶部,左边为控制菜单图标和窗口名称,右边为窗口控制按钮。,2菜单栏,标题栏
21、下面是一行由10个菜单项组成的主菜单,其内容为:File 文件操作 Edit 文件编辑 View 视图 Data 建立数据与数据整理 Transform 数据转换 Analyze 统计分析 Graphs 绘图 Utilities 实用程序 Windows 窗口信息与控制 Help 帮助,3工具栏,为了方便用户,SPSS把一些常用的命令以图标按钮的形式组成一个常用工具栏置于菜单条下面。,4状态栏,状态栏位于窗口的底部,显示SPSS工作的当前状态。当执行Analyze菜单项中过程时,状态栏中显示正在执行的相应过程名称。,5数据表视窗(Data ditor),数据表视窗用于数据输入、编辑、显示。视窗
22、中为一个可扩展的平面二维表格,表格的顶部为变量名,表格的左边是观察单位序号。一个变量名和一个观察单位序号就对应了二维表格中的一个单元格(Cell)。视窗的工具栏下面有一个条形栏,它的左边为窗口状态栏,显示输入数据的记录号和变量名,右边为输入数据栏,显示从键盘输入的变量值。当用户选定某个单元格位置,它就被圈为黑框,用户从数据输入栏输入数据,单击该单元格或回车后,数据就以隐含格式进入黑框。,6变量表视窗(Variable View),变量表视窗用于定义、显示变量和编辑变量特征,视窗中有一个平面二维表格,表格的顶部为变量特征,表格的左则是变量序号,一行可定义一个变量。定义变量有如下内容:变量名(Na
23、me),变量类型(Type),变量宽度(Width),保留小数位(Decimal),变量标签(Label),变量值标签(Values),缺失值(Missing),变量显示(Columns),对齐方式(Align),变量类型(Measure)。,二、结果输出窗(Viewer),SPSS 软件包对数据进行分析后,把统计分析的结果自动地写到结果输出窗口中。该窗口由左右两框组成:左框主要显示输出的标题,为右框的内容提供了一大纲视图,右框主要显示统计图、表以及一些文字说明(输出统计分析结果)。移动该窗口的垂直与水平滚动条便可看到输出结果的全部内容,或可用鼠标单击左框中的标题直接转入相应的输出结果。左框和
24、右框的宽窄可通过移动两框架间的纵线调节。双击左框架所选内容的标题图标可在右框架中显示或隐藏该内容,还可以通过移动左框中的选项来改变输出结果的顺序。,二、结果输出窗(Viewer),二、结果输出窗(Viewer),打开结果输出窗有以下几种方式:在第一次产生分析结果的SPSS过程后,结果输出窗被自动打开;打开新的结果输出窗,从菜单选择File/New/Output。根据输出结果的3种形式,即文本、图形和表格,结果输出窗相应地设有3个编辑器,即文本编辑器、统计图编辑器和统计表编辑器,输出结果可通过激活这些编辑器进行编辑。,三、程序编辑窗(Syntax Editor),程序编辑窗口用于建立、编辑命令文
25、件和其它文本文件。命令文件由若干条SPSS命令组成。,用SPSS实现其统计分析过程,1启动SPSS2.数据文件的建立或读入(1)制定数据文件结构(2)录入数据(3)编辑数据文件 3数据的统计处理4结果输出5保存文件,数据文件的建立,SPSS所处理的数据文件有两种来源:一是在SPSS环境下新建数据文件;二是从SPSS外部调用已建立的数据文件。在SPSS环境下新建数据文件,一般来说,包括三个步骤:定义变量,录入数据,保存数据。,一、定义变量,定义变量名定义变量类型定义变量长度(小数点)定义变量标签定义变量值标签定义变量显示格式(宽度、对齐方式),定义变量步骤,(一)首先启动SPSS for Win
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 卫生 统计 spss 课件
链接地址:https://www.31ppt.com/p-2900455.html