统计分析系统sa.ppt
《统计分析系统sa.ppt》由会员分享,可在线阅读,更多相关《统计分析系统sa.ppt(53页珍藏版)》请在三一办公上搜索。
1、第2讲数据集的建立,计算中心,计算中心,SAS数据集,已有的SAS数据集,数据直接输入,其他文件格式,SAS数据分析模块,流行的数据库,SAS应用程序,数据集,计算中心,逻辑库和SAS文件,SAS对数据的分析是面对SAS数据集进行的;SAS数据集是一种SAS文件SAS文件:SAS系统创建和管理的有特殊结构的文件SAS数据集(类型为Table),SAS数据窗口(类型为View)SAS目录(类型为Catalog)等.SAS文件存储在SAS逻辑库中,计算中心,SAS逻辑库的文件用两级命名方式逻辑库名.文件名SAS每次启动时会自动指定5个逻辑库Work,Sasuser,Sashelp,gismaps,
2、mapsSasuser库保存与用户个人设置有关的文件Sashelp库保存与SAS帮助系统、例子有关的文件。SAS逻辑库临时库:名为WORK,系统自动指定永久库:可由用户定义,逻辑库和SAS文件,计算中心,用户自定义SAS逻辑库交互方式命令方式Libname 逻辑库名 SAS文件的存储目录;,逻辑库和SAS文件,逻辑库和SAS文件,Libname aa“e:sasdata”;Data aa.class;.,计算中心,Sas中数据集aa.Class,Windows下文件Class.sas7bdat,定义一逻辑库aa新建一数据集class.,计算中心,逻辑库和SAS文件,用资源管理(浏览)器查看逻辑
3、库进入浏览器窗口即可查看SAS文件库的属性和内容库名处点鼠标右键选属性可显示该库属性,计算中心,SAS的名字 SAS的名字(数据集名、变量名、逻辑库名等等)有以下命名规则:1)由英文字母、数字、下划线组成;2)第一个字符必须是字母或下划线;3)不区分大、小写字母。另外,SAS逻辑库名最多用8个字符;数据集和变量的名字最多用32个字符。,逻辑库和SAS文件,计算中心,SAS数据集(1)描述部分 包含该数据集的一般信息,包括:数据集的名字及其成员类型、数据集建立的日期和时间、观测的数目、变量的数目以及数据集中每一个变量的特征信息,包括:Name(变量名)、Type(类型)、Length(长度)、F
4、ormat(输出格式)、Informat(输入格式)、Label(标签)。(2)数据部分,逻辑库和SAS文件,计算中心,SAS数据集的建立数据来源及相应方法,数据存于纸上需直接键入,数据存于文本文件,数据存于流行数据库文件中,计算中心,用VIEWTABLE窗口建立数据集,(1)创建数据集单击“工具/表编辑器”单击表头顶端单元格,输入变量名在变量名下方单元格中输入数据变量类型的定义:右击变量名/column attributes,计算中心,用VIEWTABLE窗口建立数据集,数据集中变量的属性变量名(Name):字母或下划线开始且不超过32个(V6为8)个字符、数字或下划线构成类型(Type):
5、数值型、字符型($)长度(Length):缺省8字节(32767)标签(Label):256字节输入格式(Informat):输入格式名w.d输出格式(Format):输出格式名w.d,计算中心,用VIEWTABLE窗口建立数据集,输入输出格式,7.2comma9.2dollar10.2,输入数据,输入格式,实际存储 数据值12234.12,输出格式,8.2comma9.2dollar10.2,输出数据,12234.1212,234.12$12,234.12,122341212,234.1234$12,234.1234,计算中心,(2)保存数据集单击文件/保存或另存为选一个库名定义数据集名(3
6、)打开已有数据集工具/表编辑器文件/打开,计算中心,用SAS INSIGHT创建数据集,SAS/INSIGHT是一个交互式的数据探索和分析工具,它提供了所有的常用统计分析方法。用这一软件可以通过多窗口连动的图象和分析结果对数据进行探索,分析单变量分布,用相关和主成分研究多变量间的关系,用方差分析和回归分析说明、拟合变量间关系的模型。SAS/INSIGHT也可以创建和编辑数据集,计算中心,用SAS INSIGHT创建数据集,单击菜单“解答/分析/交互数据分析”启动SAS INSIGHT模块 在弹出的“SAS INSIGHT:Open”对话框的Library列表框中选定库逻辑名 单击New按钮 首
7、先在行列交汇处的数据区输入数据值(如下所示),数据的变量名在缺省情况下分别用A,B,C等命名。变量的类型(数值型(Interval)和字符型(Nominal)也显示在数据表的变量上方。,计算中心,用SAS INSIGHT创建数据集,用鼠标单击在数据表左上角的三角形按钮 系统弹出对数据表进行编辑 的快捷菜单 Find Next:翻卷数据窗口到下一个被选择观测。若没有被选中的观测值,则翻卷一个观测值。Move to First:将选中的观测或变量分别移至数据窗口的第一行或第一列。Sort:根据一个或几个变量对观测排序。New Observations:插入空行,以便输入新观测值。New Varia
8、bles:加入空间,以便输入新变量。,计算中心,用SAS INSIGHT创建数据集,Define Variable:重新定义变量 File Values:修改该数据窗口的数据值,可生成常数或以常数为增量的变量值。Extract:从已存在的数据窗口抽取数据子集来生成新的数据窗口。Data Options:设置控制数据窗口外观和操纵的选项。单击菜单“File/Save/Data”,在弹出的对话框中选定库名并定义数据集名,计算中心,将文本格式的数据导入文件/导入数据/Select a data source from the list/Tab delimited file(数据间以制表符分隔)/ne
9、xtWhere is the file/Browse/打开文本格式的文件/Options/选择数据所在的行/OK/next选择一个库名定义一个数据集名,用导入菜单,计算中心,将EXCEL格式的数据导入工具/表编辑器文件/导入数据/Select a data source from the list/Microsoft Excel 2000/nextWhere is the file/Browse/打开Excel格式的文件/Options/选择数据所在的工作表/OK/next选择一个库名定义一个数据集名,用SAS/ACCESS,计算中心,将SAS格式的数据导出到Excel工具/表编辑器文件/导出
10、数据/选择一个库名选择一个要导出的SAS数据集选择导出数据的格式Where do you want to save the file/Browse/保存Excel格式的文件/Next/Finish,用SAS/ACCESS,计算中心,SAS语言,数据步DATA步,过程步PROC步,原始数据,SAS表,SAS表,报告,数据步常用于创建数据集,过程步常用于处理数据集(生成报表、图形和实现数据分析功能),如proc print,计算中心,数据步与过程步SAS程序包括多个步骤和一些控制语句,一般情况下由两种类型的程序步(steps)组成:数据步(DATA steps)和过程步(PROC steps)数据
11、步通常用于创建SAS数据集,但也可以用于产生特别设计的报表。过程步通常用于分析和处理SAS数据集中的数据,但有时候也可用于创建数据集。,SAS程序概述,计算中心,用SAS程序建立数据集,程序的基本结构DATA 数据集名;INPUT 变量名表;其他数据步语句;CARDS;若干数据行RUN;,武汉大学计算中心,LOGO,1.临时数据集的建立,例1创建一临时数据集class1DATA CLASS1;INPUT NAME$AGE gender$H W B;CARDS;刘明 3 男 0.94 13.59 50.4 蔡行 3 男 0.91 14.20 50.0 李敏 4 女 1.39 16.15 51.6
12、 李涛 4 男 1.02 15.44 51.9 夏天 4 男 1.06 15.30 51.0 郭红 5 女 1.01 15.04 51.9 胡月 5 女 1.02 15.07 52.7 程彬 6 女 1.07 17.04 53.7 杨兵 6 男 1.12 18.09 54.1 刘进 6 男 1.14 18.80 53.5 王苗苗 7 女 1.16 19.93 55.5 张思凡 7 女 1.15 18.20 51.4RUN;PROC PRINT;RUN;,武汉大学计算中心,LOGO,2.永久数据集的建立,例2创建一永久数据集classbLIBNAME aa“e:sasdata;DATA aa.C
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计分析 系统 sa
链接地址:https://www.31ppt.com/p-6332740.html