医学数据统计处理及SAS软件的应用.ppt
医学数据统计处理及SAS软件的应用,主讲人:董光辉中国医科大学卫生统计教研室,SAS软件简介,SAS是美国与西欧使用最为广泛的三大著名统计分析软件(SAS,SPSS和SYSTAT)之一,是目前国际上最为流行的一种大型统计分析系统,被誉为统计分析的标准软件。是国际上公认的最权威的统计软件。以苛刻严格著称于世的美国FDA新药审批程序中,新药试验结果的统计分析规定只能用SAS进行,其他软件的计算结果一律无效!哪怕只是简单的均数和标准差也不行!由此可见SAS的权威地位。2004年开始中国新药临床试验结果规定应用SAS软件分析。,SAS与SPSS比较,作为统计软件大家族里的“傻瓜相机”,SPSS的功能是最弱的,但易用性排在所有统计软件之首。不过SPSS的易用性也极大的限制了它的功能和可扩展性。除了SPSS本身的菜单提供的功能,用户无法通过编程或者插件来扩展它的功能,而且SPSS提供的都只是最基本的常用的方法。,SAS全球专业认证,SAS专业认证是一项拥有极高国际声誉的专业认证,在欧美等国的职场上流行的一句话“If you have a SAS certification,You will never lose your job”。销售模式:只租不售(每5年一个周期)财富500强中97%的企业都在使用SAS商业智能解决方案,2003年(301医院与军事医科院博士生)各统计软件使用情况,Pubmed检索SCI英文文献各统计软件使用情况,SAS软件功能,进行数据管理数据输入、建库、保存 进行统计分析t检验方差分析卡方检验相关、回归秩和检验,SAS的安装,SAS8.12版本是windows操作系统下的32位软件,和其他windows系统下的软件安装方法类似。用鼠标左键双击光盘根目录下的setup图标,然后按照提示安装。,SAS的启动,单击开始菜单“程序”项。桌面上双击此快捷方式也可启动SAS。,执行开始菜单中程序单项【程序】【The SAS System】【The SAS System for Windows】,SAS退出,方式1:选择关闭按钮方式2:执行菜单命令【File】【Exit】方式3:在命令框执行BYE或ENDSAS命令,SAS窗口,PGM窗口(Program Editor):提供编写SAS程序的文本编辑器LOG窗口:显示执行程序过程中的相关信息OUTPUT窗口:显示程序运行的结果 命令窗口与探索者窗口,SAS程序的编写,一个完整的SAS程序一般由数据步(DATA步)和过程步(PROC步)两部分组成。DATA步以DATA语句开始,通过指定数据集名称、定义变量名及类型和读入数据等建立SAS数据集。过程步以PROC语句开始,通过调用不同的分析模块来分析SAS数据集。,其它格式的数据库直接导入转换:excel(.xls);dbase(.dbf);lotus(.wk)等将数据读入系统,建立数据集(直接输入Editor窗口)。,SAS数据集建立,外部数据导入,例:有一批体检数据,包括受检者的姓名、性别、年龄、身高、体重信息。要求按性别分别计算身高、体重的描述性统计量:均值、标准差、最大值、最小值。该数据以Excel.xls文件形式储存。文件名称:tijiandata.xls,探索者窗口,在Editor 程序编辑窗口输入源程序,数据步:将数据读入系统,建立数据集:DATA语句开始,后面加上数据库的名字。INPUT语句描述数据变量,用$表示变量是字符型CARDS语句指示后面是数据,每行为一个观测数据,数据间无分号。数据最后以“;”开头的空行结束。每个语句都以“;”结束。,SAS程序数据步格式,Data;Input$.;Cards;.;,SAS过程步,对数据集中数据进行分析、处理。以PROC语句开始,调用SAS过程。每个语句都以“;”结束。整个程序最后要有RUN语句。,SAS程序的书写格式,不分大小写单个名称中不能空格,不同名称间必须空格一行可写多条语句,用分号分割一条语句可写多行数据行后不加分号,数据最后单独加分号行程序用“RUN;”语句结束,运行SAS程序,方式一:鼠标点击执行按钮 方式二:按功能键“F8”方式三:执行菜单命令 RunSubmit方式四:在命令框输入SUBMIT 命令并执行,SAS程序实例,例子 某学生上学期8门课程的分数分别为88,90,87,76,92,78,80,86。试用SAS编程求其平均分数。(1)在PGM窗口键入下列程序data fenshu;input chengji;cards;88 90 87 76 92 78 80 86;proc means;var chengji;run;过程步,数据步,查看结果(output 窗口),Analysis Variable:chengji N Mean Std Dev Minimum Maximum-8 84.6250000 5.8782286 76.0000000 92.0000000-从结果看出,该学生上学期8门课程的平均成绩为84.625。,查看运行过程及出错信息,激活LOG窗口(F6)黑色文字:源程序及运行情况蓝色文字:程序运行情况的说明信息红色文字:出错信息绿色文字:警告信息,保存SAS程序及其他窗口内容,激活相应窗口,然后选择:方式一:鼠标点击“存盘”工具按钮 方式二:执行菜单命令【File】【Save】/【Save as】可保存程序、数据文件、运行结果、日志等。SAS保存成纯文本格式文件(.txt)。,在SAS系统内打开已保存的文件,只能在Program Edit窗口打开文件,选择:方式一:鼠标点击“打开”工具按钮 方式二:执行菜单命令【File】【Open】可打开以前保存的程序、数据文件、运行结果、日志等文件及其他文本格式的文件。,SAS程序主要关键词,means;(n,mean,std,Q1,Q3,CV,median,clm)univariate normal;(正态性检验,均数是否为0的 假设检验:参数与非参数检验)ttest;(两个样本均数比较的t检验)anova;(各样本含量相等的方差分析)glm;(各样本含量不等的方差分析)npar1way;(非参数检验)reg;(线性回归方程:单元或多元)corr;(线性相关:线性相关或秩相关)freq;(卡方、Fisher检验)logistic;(非线性回归)lifetest;(生存分析),proc,定量资料的描述性分析,分析结果,定量资料的正态性检验,正态性检验结果,配对设计的t-test,为了比较两种方法对乳酸饮料中脂肪的含量测定结果是否不同,随机抽取了10份乳酸饮料制品,分别采用哥特里-罗紫法和脂肪酸水解法测定其结果,问两种方法检测结果是否不同?,成组设计资料的t-test,采用国产药物和进口药物治疗绝经后妇女骨质疏松症,试比较两种药物的疗效是否有差别,完全随机设计资料的方差分析(教科书73页),方差齐性检验,四格表资料的2-test,某医师欲比较胞磷胆碱与神经节苷脂治疗脑血管疾病的疗效,将78例脑血管疾病患者随机分为两组,试比较两种药物的疗效,配对四格表资料的2-test,配对设计的卡方检验,非参数检验(配对),非参数检验,比较小白鼠接种三种不同菌型伤寒杆菌9D、11C、DSC1后存活的日数。,直线相关与回归,某地方病研究所调查了8名正常儿童的尿肌酐含量,试估计尿肌酐含量对其年龄的回归方程。,