1SAS系统入门研.ppt
2011秋季研SAS课程时间安排,讲课时间:第8、9周,周三下午4节课,14:017:40,第10-17周,周三下午1、2节,14:0015:50,上课地点:植保楼101教室实验时间:10-17周,周三下午3,4节,16:0017:40实验地点:科研楼一层微机实验室.,SAS课程考核要求,平时实验课练习:书后习题:每章选做23题考核标准:1.40分钟上机操作考试,有试卷(30分)时间:2011年12月28日(16:0017:00)2.课程报告(从方差分析、多元回归分析、聚类分析、主成份分析中任选两种分析方法进行数据分析,重点是对结果的分析说明及结论的解释说明。)(70分)注:课程报告不能使用SAS书中的例题和书后习题中的数据,最好找自己的试验数据,或其它的数据进行分析。从所讲的五种分析方法(T检验、方差分析、回归分析、主成份分析、聚类分析)中任选一种方法进行数据分析,并出分析报告,用A4纸打印,并于2012年1月4日(下午2:05:00)交到科研楼一层微机实验室。或交到东校区信电大楼577室。课程分析报告格式参考“SAS分析报告样例.doc”文档。Email:,2011秋季研SAS课程时间安排,上课用书SAS统计分析及应用 黄燕主编,机械工业出版社或其它相关的SAS统计分析教程。讲义放在:ftp:/202.112.162.111点右键,选”登录”,用户名、密码均为:stu,1 SAS系统入门,中国农业大学信电学院 计算机系黄 燕,1.1 系统概述,SAS(Statistical Analysis System)系统是国际著名的数据分析软件系统。SAS系统软件是模块式结构,最常用的三个模块分别是SAS/BASE(基础)、SAS/STAT(统计)和SAS/GRAPH(图形),另外还有SAS/ETS(预测)、SAS/IML(矩阵运算)和SAS/Enterprise Miner(数据挖掘)等20多个模块。,1.1 系统概述,SAS/BASE和SAS/STAT是SAS系统的核心平台和精华,是用来解决实际问题的主要模块。重点介绍SAS/BASE和SAS/STAT两部分中常用的统计分析模块,同时讲述涉及到的常用的绘图功能。,1.2 SAS系统界面操作指南,1.2.1 SAS的启动与退出,1.2.2 SAS系统界面简介,SASv8.2的破解时间操作步骤,首先将计算机的系统时间调整到(2002.1.12002.10.1)的时间。执行Setup.exe文件进行安装,按提示信息点“下一步”,直到完成安装。将文件 复制到桌面上,不要改动机器的时间,重新启动计算机。在启动计算机时,按F8键,选择“安全模式”启动计算机。,SASv8.2的破解时间操作步骤,5.启动计算机后,双击文件6.在窗口中点击按钮“Apply Patch”,选择SAS软件安装的目录,通常为:C:Program FilesSAS InstituteSASV8点击“确定”后,窗口中出现“Apply Successfully”,说明时间破解成功。重新启动计算机后,可将计算机系统时间改为当前。,SASv8.2的安装,修改SASV8.CFG文件。在SAS软件安装的目录 C:Program FilesSAS InstituteSASV8中找到文件用记事本打开该文件,按图中所示删掉指定的两条语句两侧的标记符“/*/”,然后保存文件。,修改前,修改后,SAS三个最重要的窗口为:EDITOR 程序编辑窗口,LOG 运行记录窗口,OUTPUT 输出记录窗口(参考图1-2)。EDITOR编辑窗口用于编辑SAS源程序文件。编辑窗口支持全窗口编辑功能,即光标可以在整个窗口内随意移动,支持Windows系统常规编辑操作,如复制、剪切、粘贴等功能操作。SASV8提供了智能编辑功能,它可根据用户输入的SAS关键字、语句选项、变量名、数据、标记等不同内容显示不同的颜色,当用户输入的字串不正确时,对应颜色不对,警告使用者有错误发生。,LOG运行记录窗口用于显示和记录SAS程序的运行情况,说明程序运行成功或存在错误,当程序出现错误时,LOG记录窗口中以红色字符显示错误信息,以绿色显示一些警告信息。提示使用者修改程序中的错误。OUTPUT输出窗口分页显示SAS程序运行所产生的文本输出结果(图形输出通过GRAPHICS窗口显示)。对于文本结果的输出,可以使用主界面的菜单File|Save As将结果文档保存在磁盘中,保存的文件扩展名为.lst,但实际上是一种文本文件格式,可以使用文字处理软件,如Word或写字板、记事本等打开并进行编辑修改。对于输出到GRAPHICS窗口的图形,可以使用菜单File|Export as Image将图形导出保存在磁盘中,图形文件格式可以在“保存类型”下拉列表中选择。,SAS程序的一些语法规定:,SAS程序由 语句组成。每个语句用半角分号“;”)作为结束符(注:不能使用中文的分号“;”。程序命令使用的英文单词不区分大小写字母(系统对于数据集中的数据字符串区分大小写字母)。SASV8版中提供了智能编辑窗口,在智能编辑窗口中输入的SAS程序使用的关键字、语句、数据、标识都由不同颜色显示,当你输入错误时,颜色显示不正确,这样我们可以方便地查找及改正错误。,SAS程序的一些语法规定:,SAS程序由两类“操作步”构成,一种叫 数据步(Data Step),一种叫 过程步(Proc Step),数据步以DATA语句起始,过程步以PROC语句开始。每个“操作步”由若干条语句构成,一条语句可以占多行,多条语句也可以写在一行内,在语法上只要保证每条语句以半角分号“;”作为结束符即可。通常我们应该在程序中保持每条语句单独分行的风格,使得程序具有更好的可读性。每个SAS过程一般以RUN语句结束。有些过程需要使用QUIT语句结束运行。,1.3 SAS数据集及SAS的文件管理,1.3.1 SAS数据集、逻辑库及文件1.SAS数据集:SAS数据集文件的管理涉及到数据集、逻辑库两个基本概念。SAS数据集以特殊格式的二进制文件保存,可以利用SAS系统中的VIEWTABLE表打开、修改数据集文件,通过Explorer窗口的 Libraries访问或保存磁盘中某目录中的数据集文件。,2.SAS的数据集和变量名命名规定,SAS标识符由英文字母、数字、下划线组成;第一个字符必须是字母或下划线;标识符的长度不易过长,Windows版已允许超过8个字符;标识符中不区分大小写字母,同一个字母的大写、小写SAS系统认作同一个字符。合法的命名,如:name,abc,aBC,x1,year12,_NULL_等,且NAME、Name和name表示的是同一个标识符。不合法的命名,如:class-1(不能有减号)、a bit(不能有空格)、serial#(不能有特殊字符)、2treat(不能以数字开头)、处理1(不能以中文命名)。,2.SAS逻辑库(Libraries):,SAS文件通常无法通过一般的文本编辑器阅读,必须通过SAS系统以对应方式打开浏览。SAS系统为了便于管理和使用SAS文件,将它们按照不同的应用需要集中管理,每个文件的集合就称为一个SAS逻辑库(Library)。SAS系统除了用户可以建立自己定义的逻辑库之外,系统提供了三个预定义的SAS库:WORK、SASUSER、SASHELP。其中,WORK库称为临时逻辑库,用于存放SAS系统工作过程中的临时数据集文件,当用户退出SAS系统时,库中的文件会被自动删除。,建立SAS逻辑库:在Explorer窗口内双击图标,,3.通过SAS命令菜单方式建立逻辑库名与子目录的连接:操作过程为:进入Explorer窗口/右击(Library)图标/选择“new”命令/在弹出的窗口(见图)的name栏中输入库名/在Path栏中输入目录路径或点击右侧的“Browse”按钮选择磁盘中的文件夹/选中右侧的“Enable at startup”使其永久有效,然后点“OK”完成新库名的定义。,综上所述,SAS文件本质上可以分为临时文件和永久文件两类:临时文件在退出SAS系统时自动被删除,永久文件则会长期保留在磁盘中。所以,在应用过程中,我们通常把中间结果数据集或练习数据集作为临时数据集文件保存,而将以后需要使用的数据集保存为永久数据集。,1.3.21.3.2 建立SAS数据集,1、用VIEWTABLE建立SAS数据集,2.修改数据集3.向已存在的数据集中添加一行新记录,打开数据集后,选择菜单Edit|Edit Mode使数据集成为可编辑模式,然后选择菜单Edit|Add Row添加一行空行并将数据输入到相应的列中,然后选择菜单Edit|Commit New Row将新行提交到该数据集中,然后点保存命令保存修改后的数据集。4.文件复制,1.3.3数据集排序,选择菜单Edit|Edit Mode将要排序的数据文件改为可编辑模式;选择菜单Data|Sort,弹出Sort窗口(见图);,1.3.4 修改SAS数据集变量名,用VIEWTABLE打开的数据集无法更改变量名及变量类型。当需要更改时,可以使用SAS系统提供的RENAME语句,通过SAS程序的运行,调出原有的数据集,更改变量名后生成一个新的数据集,而原始数据集中的变量仍保持不变。例1.1 L3.STUA1DATA L3.STUA1;/*建立一个新数据集,名为STUA1,放在L3库关联的目录中*/SET L3.STUA;/*将已存在的数据集STUA调出*/RENAME INTIME=INDAY;/*将数据集STUA中的变量名INTIME变更为INDAY*/RUN;一条语句也可以同时修改多个变量名:RENAME OLD1=NEW1 OLD2=NEW2 OLD3=NEW3;,1.4 数据集的导出/导入,1.4.1外部数据导入SAS数据集Excel数据文件导入成SAS数据集要注意以下几点:建立的Excel数据文件的变量名放在第一行,且变量名为英文字母开头的字符串,不要用中文字符串当变量名;字符型变量的数据不要用中文,要使用英文字符串或汉语拼音;Excel数据文件的文件名不要用中文命名,应以英文字母开头的字符串命名;一定要将Excel数据文件关闭后,再执行导入操作。如果该Excel文件处于打开的状态,则在SAS系统导入过程中将不能生成SAS数据集。(转SAS系统实际操作演示),1.4.2导出SAS数据集,1.5数据集的合并,建议使用Excel 将数据整理好,Excel表中的列名为英文或拼音加数字,并以英文字符串命名文件名保存好,然后采用导入方式生成SAS数据集。,