SAS系统快速入门(共20).ppt
《SAS系统快速入门(共20).ppt》由会员分享,可在线阅读,更多相关《SAS系统快速入门(共20).ppt(65页珍藏版)》请在三一办公上搜索。
1、第2章 SAS系统快速入门,清华大学经管学院 朱世武Z,本章内容提要,SAS系统简介 SAS系统工作环境 存取和管理数据 呈现数据 分析数据,SAS系统简介,全称为Statistics Analysis System,最早由北卡罗来纳大学的两位生物统计学研究生编制 1972研制出第一版,1976年成立了SAS软件研究所,正式推出了SAS软件,现在是8.2版 是用于数据分析与决策支持的大型集成信息系统,统计分析功能是它的重要组成部分和核心功能 国际上的标准软件系统,SAS功能模块,BASE SAS模块 SAS/STAT-统计分析模块 SAS/ETS-经济计量学和时间序列分析模块 SAS/OR-运
2、筹学模块 SAS/QC-质量控制模块 SAS/IML-交互式矩阵程序设计语言模块 SAS/GRAPH-绘图模块 SAS/FSP-快速数据交互式菜单系统模块 SAS/AF-交互式应用开发模块,SAS功能模块,SAS/ASSIT-菜单驱动界面模块 SAS/ACCESS-访问外部数据模块 SAS/EIS-企业信息系统模块 SAS/INSIGHT-可视化探索工具模块 SAS/CALC-电子表格模块 SAS/CONNECT-分布式数据处理模块 SAS/WA-企业级数据仓库管理模块 SAS/EM-企业级数据挖掘模块,SAS模块的分类,SAS系统的特点,由大型机系统发展而来 针对专业用户进行设计 程序驱动,
3、功能强大 高级编程语言 具有工业用途的分析软件,SAS技术水平的三个层次,第一层面:会使用SAS菜单以及一些菜单界面的SAS模块,了解初步的SAS BASE语句,能用SAS系统作简单的数据加工处理和分析,具有一定的数理统计知识,掌握一定的SAS STAT过程。第二层面:精通SAS BASE,能用SAS语言编写复杂的SAS程序,能用SAS BASE进行大型的、复杂的数据加工整理和呈现,掌握SAS和外部数据文件的接口,会进行复杂的统计建模和分析等,初步掌握一种基于SAS的开发工具。第三个层面:在一、二层面基础上,进一步掌握SAS/AF,SAS/IML等,能开发基于SAS的数据管理和分析模块。,本章
4、目的,让初学者能够快速地熟悉SAS系统的应用,完成一些简单的数据处理和分析,即快速得到SAS技术第一层面水平。本章主要介绍SAS系统的菜单操作,配合命令和功能键的使用。有些地方也会附带介绍SAS系统中的一些基本概念,使初学者能够边练习边了解SAS系统。本章基于SAS菜单操作,基本上都可以通过SAS语言编程来实现。所以,读者一定要学好本书以后关于SAS语言方面的内容,那些才是SAS软件的精华,只有利用SAS语言编写程序才能更有效地发挥SAS软件的强大功能。本章目的绝不是本书的目的,仅具备第一层面的SAS水平是很难体会SAS的优势,不如学其它任意一种简单的统计分析软件。,SAS的工作界面,缺省情况
5、下的活动窗口,SAS资源管理器窗口 结果窗口 编辑器窗口(F5)日志窗口(F6)输出窗口(F7),资源管理器窗口,管理SAS逻辑库和文件快捷方式 逻辑库存贮SAS文件 文件快捷方式标识外部文件 四个系统逻辑库:Maps Sashelp Sasuser Work,编辑器窗口,编辑器窗口用来编辑SAS 程序,编辑器能够实现如下的功能 对SAS语言的彩色编码和语法检查 可展开或折叠程序片段 可记录宏 支持键盘快捷方式(Alt 或 Shift)加上其它键 多层撤消和恢复,SAS程序的一般特点,语句用分号结束 不区分大小写 空格、空行一般可以任意放置 SAS程序由数据步和过程步构成,日志窗口,程序行黑色
6、:以语句标号开始 提示蓝色:以NOTE开始 警告绿色:以WARNING开始 错误红色:以ERROR开始,输出窗口,输出SAS程序的执行结果,结果窗口,结果窗口可以查看和管理SAS程序的输出结果,两类菜单栏,菜单栏的下拉菜单 操作:点菜单栏中的按钮,弹出菜单操作:相应窗口点鼠标右键,命令行,命令行中输入SAS命令,工具栏,定制工具栏:右击工具栏选定制,SAS窗口条,通用极大极小化窗口操作,浏览文件,资源管理器窗口是管理SAS文件的简单界面,数据库操作,SAS8.2系统的四个预定义数据库:Work数据库叫做临时库,存放在其中的SAS文件叫临时文件,这些临时文件当退出SAS系统时会被自动删除。Sas
7、user库保存与用户个人设置有关的文件,它是永久的,即退出SAS时文件不会被删除。Sashelp库保存与SAS帮助系统、例子有关的文件,是永久的。Maps,建立一个新的数据库,在资源管理器窗口双击逻辑库图标。选文件新建 输入newlib,引擎选项中保留默认项,选中启动时启用 可以选择其他的引擎,读入不同格式的数据文件。点击浏览按钮,选上这个数据库的目录,点击确定。点击确定按钮,在资源管理器窗口出现newlib图标。,在资源管理器窗口双击Sashelp数据库图标。在数据库中找到一个叫Class的数据表文件,选中这个文件的图标,在弹出菜单中选复制。回到上一级目录,双击Newlib数据库图标。在空白
8、处点鼠标右键,在弹出菜单中选粘贴。在新建的数据库中出现一个Class的文件。用户还可以实现将数据表文件打印、删除、重命名等操作,复制SAS数据表到新的数据库中,创建文件快捷方式,选文件另存为,在保存在一栏中选择你要保存的目录,在文件名中输入文件名newproc,点保存按钮。在资源管理器窗口双击文件快捷方式图标。选文件新建,则出现一个文件快捷方式赋值的窗口。输入名称newproc,选中启动时启用。点击浏览按钮,选择刚才保存的文件newproc.sas。点确认。,功能键,调出功能键(KEYS)窗口,F9调出功能键窗口。例如F3、F8是提交SAS程序 F4是调用刚提交的程序 F5、F6和F7分别是调
9、用编辑器窗口、日志窗口和输出窗口。CLTE是清除窗口中的内容,添加新的功能键定义,按F9调出功能键窗口按F12添加新的功能键在命令行中输入命令“END”或“SAVE”来保存这个设置。这个设置一直有效,直到用户再次修改或清除它。,SAS数据集,在SAS系统中,数据是以数据集的形式来存储和处理的。SAS数据集(SAS Datasets)可以看作由若干行和若干列组成的表格。SAS 数据集存放在以特殊格式存放的二进制文件中,用一个SAS逻辑名来使用SAS数据集,不需要知道它在磁盘存储的物理地址。数据集的每一行叫做一个观测(Observation),每列叫做一个变量(Variable)。SAS数据集等价
10、于关系数据库系统中的一个表,SAS数据集有时也称作一张表。,以Class数据表文件为例,这个文件实际上就是一个数据集。这个数据集中有5个变量,分别是姓名(name)、性别(sex)、年龄(age)、身高(height)、体重(weight)。数据集中有19个观测,其中每一个学生的资料都是一个观测,每个观测包括了以上5个变量的数据。,Observation,Variable,SAS名字由英文字母、数字、下划线组成;第一个字符必须是字母或下划线;名字最多用32个字符,大写字母和小写字母不区分。,有关SAS名的约定,SAS数据集用两级水平名命名:第一级名字是SAS逻辑数据库的库名;第二级是文件的名字
11、。例如Sashlep.Class,Sashelp是数据库的名字,而Class则是文件本身的名字。临时数据集和永久数据集的区别:临时库数据集可以使用单水平名或双水平名;而永久库数据集必须使用双水平名字来加以确认。例如Work.Class和Class都代表临时库中的文件,而Sashlep.Class则是永久库中的文件。,浏览和编辑数据,打开数据表文件:选择下拉菜单工具表编辑器。在VIEWTABLE窗口状态下选择文件打开。在对话窗口中选择相应的数据库和要打开的文件 在命令行中输入“VT(数据表文件名字)”。其中,数据表文件名字必须根据刚才介绍的命名规则来输入(临时数据集用单水平或双水平名,永久数据集
12、用双水平名),移动和隐藏列,隐藏 选中这一列,然后在弹出菜单中选Hide(隐藏)一项,则这一列自动隐藏起来,但并没有从数据集中删除。要恢复显示这一列,可以选数据隐藏取消隐藏,在HideUnhide窗口中双击Hidden栏中的列变量Weight,将Weight放回到Displayed一栏中,点OK确认。则Weight列又再次显示。,移动 点击要移动的列的标题,这样就选择了这一列数据。按住鼠标左键拖动这一列到另一列的之前或之后,放开鼠标键就能改变列的顺序,改变列的标题,如果这一列没有被赋与标签值,则在表中显示的标题是这一列变量的变量名;点击某一列的标题(以Weight列来示范),在弹出菜单中选Co
13、lumn Attributes,在Column Attributes窗口中的Label一栏中输入Weight in pounds,然后点Apply按钮确认。列标题被改为Weight in pounds。然后点Close关闭该窗口。,提示 改变列的标签只能是对当前窗口有效,一旦关闭该数据表文件,列的标签恢复到原来的缺省值。因此,为了保存改变的列标签,需要将该文件另存为另外一个数据表文件。,对数据排序,学生的身高进行排序的操作:在下拉菜单中选编辑编辑模式。或直接点工具栏中的编辑图标。则VIEWTABLE窗口从浏览模式转换到编辑模式。点列标题Height选中这一列,在弹出菜单中选Sort(排序),选
14、Descending(降序)或Ascending(升序)。则身高数据自动按降序或升序排列。也可以在选中这一列之后,点工具栏的升序排序或降序排序图标,提示 各种类型的数据都可以进行排序,如果是符号变量则按字母的顺序排列,数值变量按数值大小进行排序,时间变量按时间先后排序。按某一个变量进行排序,则整个观测都按新的顺序排列,而不仅仅是这一列的数据。排序后,观测的排列顺序改变了,我们可以了解到各个学生之间的身高关系。在编辑状态下进行排序,则新的顺序关系被保存下来。当用户关闭该窗口之后,再打开这个数据集,则显示的是新的顺序关系,对数据进行筛选,在VIEWTABLE窗口状态下,选菜单数据Where。出现一
15、个WHERE EXPRESSION的对话框 在对话框的Available Column一栏中点Sex,在Operators中选EQ(等于)。在Available Column一栏中出现了一列,点击它。在新出现的窗口中选F一项。可以在Where一栏中看到这样的语句:Sex EQ F。这个语句的意思是选择性别是女性的观测数据。点OK确认。可以看到VIEWTABLE窗口只显示了女学生的资料,以上的操作选择了Class数据中的一个子集,但并没有从数据集中删除其它数据。要恢复原来的数据显示,只需要选菜单数据Where清除则可。要保存这个子集可以将子集保存为另外一个文件,编辑单元格,在VIEWTABLE窗
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SAS 系统 快速 入门 20
链接地址:https://www.31ppt.com/p-6518474.html