SAS统计学软件.ppt
教学内容,序Sas 软件概述数据集的建立,序,统计软件与统计学的关系统计软件的特点统计软件的使用方法常用统计软件,统计分析与统计软件的关系,统计学为数据分析过程提供一套完整的科学的方法论。完整的数据分析过程包括:数据的收集 数据的整理 数据的分析统计分析软件是数据分析的主要工具,统计软件为数据分析提供了实现手段。,统计分析软件的一般特点,有完善的数据定义、操作和管理功能方便地生成各种统计图形和统计表格功能全面,系统地集成了多种成熟的统计分析方法使用方式简单,有完备的联机帮助功能软件开放性好,能方便地和其他软件进行数据交换,学习使用统计软件的基本方法,弄清分析的目的正确收集待处理和分析的数据(目的、影响因素的剔除)弄清统计概念和统计含义,知道统计方法的适用范围,无需记忆公式选择一种或几种统计分析方法探索性地分析数据读懂计算机分析的数据结果,发现规律,得出分析,一般认为SAS、SPSS与BMDP(STATA)是国际公认的三大权威统计分析软件包。SPSS又以其语言通俗、操作简单、适用专业范围广泛为其特色。,常用统计软件,SAS,真正的巨无霸。被誉为国际上的标准统计软件和最权威的组合式优秀统计软件。人机对话界面太不友好图形操作界面比较糟糕基本上围绕编程设计学习起来较困难(编程)说明书非常难懂价格贵的人直跳,SPSS(Ver11),统计软件中的贵族操作界面极为友好 所有统计软件中最友好的 精心设计的图形操作界面 美观的结果输出 强大的辅助教学功能输出结果与中文WORD尚存在一定兼容问题在国内深受欢迎,特别是市场调研行业在欧洲各研究机构中得到广泛应用,Stata(Ver7),软件小巧绘图美观统计分析能力极强数据接口差不提供对话框界面,命令行方式操作,其它软件,SystatS-Plus E-ViewsPEMSR,第一章 SAS概述,SAS:Satistical analysis system 二十世纪六十年代,由美国北卡罗纳州立大学(north carolina state university)两位教授和开发,1975年创建了SAS(Satistical analysis system)研究所。,功能强大、统计软件界巨无霸,SAS是用于决策支持的大型集成信息系统,软件系统最早的功能限于统计分析,现在统计分析功能也仍是它的重要组成部分和核心功能。SAS现在的最新版本为9.0版,大小约为1GB。在数据处理和统计分析领域,SAS系统被誉为国际上的标准软件系统,并在9697年度被评选为建立数据库的首选产品,堪称统计软件界的巨无霸。,应用广泛、专业性强,SAS已经被全世界120多个国家和地区的近三万家机构所采用,直接用户超过三百万人,遍及金融、医药卫生、生产、运输、通讯、政府和教育科研等领域。由于SAS系统是从大型机上的系统发展而来,在设计上也是完全针对专业用户进行设计,因此操作以SAS语言编程为主,另外也有非编程方式的菜单系统,但人机对话的界面不太友好。,SAS的基本功能,数据交换:可以访问任何形式和格式的数据数据管理:可以将数据转换为可用格式数据分析:数据呈现:可以是信息产生社会效益和经济效益,BASE SAS:核心SAS/STAT;统计分析软件SAS/INSIGHT:交互统计图形SAS/ASSIST:The sas systems task orient,menu driven interface.SAS 的菜单管理方式SAS/GRAPH:图形软件包SAS/ACCESS:数据接口,如ODBC,ORACLE,PC,SYBASE文件格式读入,SAS/ETS software:economic times seriesSAS/OR:operation reserch and project management software可操作的项目管理研究决策软件SAS/IML:matrix programmingSAS/FSP:full screen procedures,customized data entry retrieval,and letter writing facilites.全屏幕数据录入、编辑和查询功能SAS/AF:software,application development facilities,SAS的启动和退出,启动快捷方式运行可执行文件:资源管理器开始运行-sasSAS.EXE,SAS的退出,菜单:file-exit键入命令:命令框中-byeendsas,SAS的显示管理系统,Display management system(DMS)Sas程序的编辑、运行、存储、调用、结果输出及打印,DMS窗口,Program editLogOutputResultsexplorer,常用指令,常用指令,F1 help 帮助F2 reshow 再显示F3 end;/*gsubmit*/结束该视窗F4 recall 调回上一次已运行的程 序F5 wpgm 显示程序编辑视窗F6 log 显示记录视窗F7 output 显示输出结果视窗F8 zoom off;submit 放大或缩小视窗F9 keys 打开功能键视窗F11 command focus 打开命令条F12,快捷键,SHF F1 subtopSHF F2 SHF F6 SHF F7 left 数据左移40列SHF F8 right 数据右移40列SHF F9 SHF F10 wpopup弹出视窗SHF F11 SHF F12,CTL H help CTL I options 提供选择表视窗CTL J CTL K cut 剪贴CTL L log 显示记录视窗CTL M mark 反字选择指令CTL Q filename 打开文件名视窗CTL R rfind 继续执行上一次的查找CTL T title 打开标题视窗CTL U unmark 取消反字指令CTL W access 打开存取访问,进入交谈式CTL Y,CTL F1 CTL F2 CTL F3 CTL F11 CTL F12 CTL B libname 打开库名视窗CTL D dir 打开目录视窗CTL E clear 清楚当前使用的视窗目录CTL F footname 打开脚注窗口CTL G,RMB wpopup 单击鼠标右键,显示目前视窗的选择表SHF RMB CTL RMB MMB 单击鼠标中键 SHF MMB CTL MMB,SAS程序,数据步:DATA 过程步:proc run;程序运行:工具条submit runLocals-submit,程序修改,程序保存,File c:sassasusertime.sas Filesave-,程序调用,Include c:sassasusertime.sasFileopen工具条,第二章 数据库与数据集,SAS数据库通常是存放SAS数据集与其它SAS文件。库标记:库逻辑名或库关联名数据库类型:临时数据库与永久数据库永久数据库:libname 库标记 路径 如硬盘上已经存在一个文件夹为:c:my documents,可以用如下的语句将该文件夹指定为库标记是data的永久型数据库:,SAS数据集,SAS数据集是关系型结构:描述部分:存放数据属性信息 如:变量名称、类型、长度数据部分:存放数据值 如:,变量,记录/观测值,变量,变量分类:数值型 length,attrib 缺失为.字符型 最大长度为200字节,默认为8字节;缺失是为空格变量特性:长度:是指在SAS数据集中用以存储它的每一个值的字节数。输入格式:informat w.d or w.输出格式:format w.d or w.标号,数据集命名,两级命名:如:库名 A.File临时库:prg1_1永久库:sasuser.prg1_1,库名,文件名,数据集的建立直接在编辑窗口建立,Input 和cards语句:程序1data prg1_1;input no sex$age dollar$surt;cards;1 m 41 a 368 2 m 26 b 745 3 f 35 b 401;run;,程序2,data prg1_2;input no sex$age dollar$surt;cards;1 m 41 a 368 2 m 26 b 745 3 f 35 b 401;run;,程序3,data prg1_3;input no sex$age dollar$surt;cards;1 m 41 a 368 2 m 26 b 745 3 f 35 b 401;run;,Proc print data=prg1_1;Run;,If then/else,Data prg2_41;Infile f:sasexercise11.txt;input no sex$age blood$curt;If sex=m then output;Run;,data prg2_51 prg2_52;set prg2_4;if sex=m then output prg2_51;else output prg2_52;run;proc print;run;,Drop/keep语句,data prg2_6;set prg2_4;drop age;run;Data prg2_7;Set prg2_4;Keep no blood surt;Run;,其它格式文件转换为SAS文件,文本文件转换为SAS文件 首先建立文本文件:,1 m 41 a 368 2 m 26 b 745 3 f 35 b 401 4 m 47 ab 552 5 f 37 a 478 6 f 39 0 628 7 m 28 0 549 8 m 31 b 128 9 m 43 ab 463 10 m 29 a 512,文本文件导入,其次,导入程序1(文本文件导入)Data prg2_4;infile f:sasexercise1.txt;Input no sex$age blood$surt;Run;,SAS程序导入,include格式:include path:filenameinc path:filenameFilename fileref path:filename include fileref or inc fileref,将*.dbf文件转换为SAS文件,*.dbf 文件有Dbase、/、FOXBASE、FOXPROW、VISUAL FOXPROW Dbf过程:当该*.dbf文件在SAS当前文件夹中Proc dbf db3=db4=out=;,当该*.dbf文件不在SAS当前文件夹中:filename sh f:sasexercise2.dbf;proc dbf db4=sh out=d22;proc print data=d22;run;2.dbf文件不在SAS当前文件夹中,故需为该文件指定一个逻辑文件名sh,转换后的数据集为临时数据集,名为d22.,Import 菜单选项,File import dataEdit:solution analysis analyst file open,Sas与Spss数据文件互换,1、预先在SPSS系统中将(.sav类型)目标数据转换成SAS的固定格式的原始数据、FOXBASE类型、EXCEL电子表格、LOTUS类型的数据。,Sas与Spss数据文件互换,2、另外:将SPSS系统存储一个Delimited类型的文件:在spss窗口下,file save as 选择tab-delimited(.dat)文件类型,输入文件名,最后保存。调用定界型的文件到SAS系统:启动SAS系统,进入编程窗口 选择file open搜寻和改变文件夹打开最后将第一行内容改成SAS的data和input语句,即完成数据转换。,数据集的整理,Solution Assist analysis File open Edit mode edit,新变量产生函数与运算符条件语句data prg2_13;data prg2_14;set prg2_4;set prg2_4;surty=surt/365.25;if age40 then group=1;put surty=;else group=2;run;run;,data prg2_15;set prg2_4;if sex=m and age40 then group=1;if sex=m and age=40 then group=2;run;proc print;where sex=m;run;,数据集的排序,Proc sort options;by descending varname;Options:data=out=by descending varname,data prg2_16;set prg2_4;proc print;run;proc sort out=prg2_16_1;by descending sex surt;run;proc print data=prg2_16_1;run;,数据集的连接,纵向连接 Data newname;Set name1 name2;Run;,数据集的合并,横向合并:mergeData newname;Merge name1 name2-;By keyvar;Run;,数据集的输出,Proc print out=File export,