《《统计分析系统》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《统计分析系统》PPT课件.ppt(58页珍藏版)》请在三一办公上搜索。
1、武汉大学计算中心,LOGO,内容提要,1.SAS系统的组成与特点2.SAS系统的安装3.SAS的启动退出4.SAS系统的主要界面介绍5.SAS/ASSIST窗口介绍,武汉大学计算中心,LOGO,几种统计软件,SAS-Statistical Analysis SystemSPSS-Statistical Product and Service Solutions是世界上最早采用图形菜单驱动界面的统计软件,它最突出的特点就是操作界面极为友好,输出结果美观漂亮,但其统计分析功能与SAS相比仍有一定欠缺。MINITABMinitab是为质量改善、教育和研究应用领域提供统计软件和服务的软件。,武汉大学计
2、算中心,LOGO,几种统计软件,MATLAB-Matrix Laboratory是矩阵实验室(Matrix Laboratory)的简称,是美国MathWorks公司出品的商业数学软件,用于算法开发、数据可视化、数据分析以及数值计算的高级技术计算语言和交互式环境。S-PLUS由AT&T 贝尔实验室开发的一种用来进行数据探索、统计分析、作图的解释型语言。R研究统计算法的实现,希望自己可以修改程序中的代码(免费,原代码开放),武汉大学计算中心,LOGO,SAS简介,1.SAS与统计分析 在众多的统计软件中,SAS以运行稳定、功能强大而著称。近20年来,SAS一直占据着统计软件的高端市场,用户遍及金
3、融、医药卫生、生产、运输、通讯、政府和教育科研等领域。在数据处理和统计分析领域,SAS系统被誉为国际上的标准软件,堪称统计软件界的巨无霸。在国际学术界有条不成文的规定,凡是用SAS统计分析的结果,在国际学术交流中可以不必说明算法,由此可见其权威性和信誉度。,武汉大学计算中心,LOGO,SAS简介,2.SAS的版本介绍 SAS是在1960年代末期由两位北卡州立大学(North Carolina State University)统计系的教授开发1976年,SAS软件研究所(SAS Institute Inc.)成立,开始进行SAS系统的开发、维护、销售和培训工作。早期SAS只能运行在大型机上,现
4、在SAS系统可以在各种大型机、小型机、工作站和微机上运行 PC版本的SAS于1987年推出(V6.02),1989年推出SAS/PC(V6.04)版本;1997年下半年推出适用于多种操作系统的V6.12版本(Windows版);2000年2月又推出SAS系统V8版本,2001年推出SAS系统V8.2版本;2002年推出SASV9,最新版本为9.2目前本课程教学版本为,武汉大学计算中心,LOGO,SAS简介,.SAS的应用领域SAS广泛应用于金融、保险、临床研究、医药开发、市场调查、政府监管和教育部门等。财富杂志评出的世界 500 强中,有 90%都使用 SAS 软件和方案。领跑国内BI市场SA
5、S 是全球领先的商业智能软件供应商,全球用户超过43,000家企业。SAS软件能够帮助客户从海量数据中获取智能信息以提高企业绩效,从而更快、更准确地传达决策信息,加强和伙伴、供应商之间的互利合作关系,从战略管理和运营管理两个层面同时推动企业发展。教育清华大学经济管理学院使用 SAS 作为 MBA 高级数据模型决策课程的伙伴软件。北京大学光华管理学院的硕士和博士生要求必修统计分析计算机软件课程.政府中国海关使用SAS 来审核偷税漏税、指导地方当局和打击走私 五角大楼官员依赖SAS智能来出台政策 健康、保险、电信、制造、生命科学等,武汉大学计算中心,LOGO,SAS简介,SAS认证与数据挖掘、商业
6、智能职业发展数据挖掘数据挖掘(Data Mining)就是从大量数据中发现潜在规律、提取有用知识的方法和技术。因为与数据库密切相关,又称为数据库知识发现(Knowledge Discovery in Databases,KDD)。SAS的一个组件Enterprise Miner是最流行的数据挖掘工具之一,和IBM的DB2 Intelligent Miner、微软的Microsoft SQL Server 2005 Data Mining以及SPSS Clementine等齐名,而且SAS公司一直是数据仓库的引导者.,武汉大学计算中心,LOGO,SAS简介,SAS认证与数据挖掘、商业智能职业发展
7、商业智能SAS不止是一个统计软件,它已经发展成为一个大型的商业智能(BI)平台。商业智能(Business Intelligence),简称BI,就是将智能计算技术应用于传统商业领域,从而提高数据分析能力,优化业务过程,提高企业竞争力。虽然商业智能的普及仅仅是最近几年的事情,但已经渗透到金融,电信,零售,医药,制造,政府等各个行业和领域,成为大中型企业经营决策的重要组成部分。,武汉大学计算中心,LOGO,SAS简介,.SAS认证与培训SAS认证从国际站点(不点网站首页上的中国)预约。绝大多数省会城市有考点,基本上每个工作日都可以机考。目前初级和高级考试都是115USD(信用卡付款)。对高校师生
8、有优惠。SAS培训官方北京面授培训 10000 RMB*折扣(不推荐)官方在线自学培训 300USD*折扣(不推荐)自学(推荐)注意:不考统计应用只考编程基础,武汉大学计算中心,LOGO,1.1 SAS系统的组成,SAS系统是由众多模块组成的系统。其中Base SAS模块是SAS系统的核心。其它各模块均在Base SAS提供的环境中运行。用户可选择需要的模块与Base SAS一起构成一个用户化的SAS系统。,武汉大学计算中心,LOGO,常用模块,Base SAS作为SAS系统的核心,负责数据管理,交互应用环境管理,进行用户语言处理以及调用其它SAS模块。Base SAS 为SAS系统的数据库提
9、供了丰富的数据管理功能,还支持标准的SQL语句对数据进行操作。SAS/GHAPH可将数据及其包含着的深层信息以多种图形生动地呈现出来,如直方图、饼图、星形图、散点相关图、曲线图、三维曲面图、等高线图及地理图等。,武汉大学计算中心,LOGO,常用模块,SAS/ASSIST为SAS系统提供了面向任务的菜单界面,借助它可以通过菜单系统来使用SAS系统的其它产品。SAS/AF是一个应用开发工具。用户使用SAS/AF可将包含众多功能的SAS软件作为方法库,利用 SAS/AF的屏幕设计能力以及SCL语言的处理能力来快速开发各种功能强大的应用系统。,武汉大学计算中心,LOGO,常用模块,SAS/EIS是决策
10、工具,也是一个快速应用开发工具。SAS/ACCESS:为了对众多不同格式的数据进行查询、访问和分析,SAS/ACCESS提供了与目前许多流行数据库软件的接口,利用SAS/ACCESS可建立访问外部其他数据库的一个统一的公共数据界面。SAS/STAT覆盖了所有的实用数理统计分析方法,是国际统计分析领域的标准软件。SAS/STAT提供了十多个过程,可进行各种不同模型或不同特点数据的回归分析,如正交回归/面回归、响应面回归、logistic回归、非线性回归等,且具有多种模型选择方法。,武汉大学计算中心,LOGO,常用模块,SAS/ETS提供丰富的计量经济学和时间序列分析方法,是研究复杂系统和进行预测
11、的有力工具。它提供方便的模型设定手段、多样的参数估计方法。SAS/GIS是集地理信息系统与空间数据显示分析于一体的软件。,武汉大学计算中心,LOGO,SAS系统的特点,信息存储简便灵活语言编程能力强丰富的统计分析方法较强的统计报表与绘图功能友好的用户界面,武汉大学计算中心,LOGO,SAS系统的特点,宏功能支持分布式处理采用输出分发系统功能强大的系统阅读器,武汉大学计算中心,LOGO,1.2 SAS系统的安装,修改机器时间为2006年,安装虚拟光驱运行安装文件夹下的setup.exe。安装程序首先提示用户选择安装语言,如图1-1所示。,武汉大学计算中心,LOGO,SAS系统的安装,选择“中文(
12、简体)”后单击“确定”按钮,打开安装主界面,如图1-2所示。,武汉大学计算中心,LOGO,SAS系统的安装,SAS系统安装成功后,在“开始/程序”菜单下创建有“The SAS System”程序组,如图1-3所示。,武汉大学计算中心,LOGO,SAS的启动退出,在Windows系统中,单击“The SAS System for Windows 9.1(简体中文)”菜单项,即可启动SAS系统。也可在“开始”菜单的“运行”对话框中输入命令“sas.exe”运行SAS,或在资源管理器中双击SAS安装目录中sas.exe文件图标启动SAS系统。,武汉大学计算中心,LOGO,退出SAS系统,用户需要关闭
13、时,有两种方法可以选择:单击“文件”菜单中的“退出”菜单项单击窗口右上角的关闭按钮执行以上操作后,系统会弹出如图1-7所示对话框,用户可单击“确定”按钮退出SAS系统,也可以单击“取消”按钮返回SAS for Windows继续使用。,武汉大学计算中心,LOGO,SAS系统的主要界面介绍,的主画面如下图所示。,武汉大学计算中心,LOGO,SAS帮助和文档,SAS是一个迅速发展的大型软件系统,对用户而言,要想掌握每一个技术细节是非常困难的,因此,多使用SAS的帮助系统也就显得尤为重要。SAS的帮助系统如图1-10所示。,武汉大学计算中心,LOGO,SAS的工具栏,一些常见的任务可以不需调用菜单而
14、直接用鼠标单击工具栏中的图标即可完成。把鼠标指向图标并停留几秒可以显示其功能,常见工具图标如图1-11所示。,武汉大学计算中心,LOGO,添加新库,单击添加新库图标,系统弹出如图所示对话框。在“名称”域中输入新的逻辑库标识,在“路径”域中填入逻辑库标识所对应的文件夹。用户可以点击“浏览”按钮浏览文件夹并进行选定。信息设定完成后单击“确定”按钮完成逻辑库标识的定义,单击“取消”按钮放弃添加。,武汉大学计算中心,LOGO,中断任务,有的时候可能需要撤消已提交的任务,一个简便的方法是单击工具栏中的中断任务图标,弹出如图所示任务管理器对话框。用户可以选择“取消提交的语句”撤消已提交的语句;选择“取消对
15、话框”关闭此对话框;选择“终止SAS系统”退出SAS系统。,武汉大学计算中心,LOGO,资源管理器窗口,在资源管理器窗口包含有四个图标,分别是:逻辑库(Libraries),文件快捷方式(File Shortcuts)、收藏夹(Favorite)、我的电脑(My Computer),武汉大学计算中心,LOGO,结果窗口,用户选择“查看”菜单中的“结果”或单击“结果(Results)”标签可以切换到结果窗口,在结果窗口中列出了SAS系统的输出过程。,武汉大学计算中心,LOGO,程序编辑窗口,程序编辑窗口是SAS系统中最常用的窗口之一,其主要功能如下:输入并编辑文字,包括程序语句。提交程序文件执行
16、。保存或回调源文件。保存程序文件的扩展名是*.sas。回调已执行的SAS程序语句,加以修改后,再提交执行。,武汉大学计算中心,LOGO,增强型编辑器,增强型编辑器是一个ASCII编辑器,它使用视觉辅助系统如不同颜色、代码分段等帮助用户编写调试SAS程序。,武汉大学计算中心,LOGO,日志窗口,日志窗口用于输出程序在运行时的各种有关信息。主要有以下几项内容:程序行:用黑色表示提示:用蓝色表示警告:用绿色表示错误:红色用户可以保存日志窗口中的信息,其文件扩展名为*.log。,武汉大学计算中心,LOGO,输出窗口,输出窗口的主要功能是显示各个过程的分析结果,用户可以保存结果并进行修改、打印等处理。保
17、存的结果文件扩展名为*.lst。,武汉大学计算中心,LOGO,SAS/ASSIST窗口,SAS/ASSIST提供了一个非编程的菜单式操作界面,可以输入、转换、编辑数据,管理、分析数据并生成报表。新用户和没有经验的用户可以不需学习、记忆复杂的SAS程序语言就可以利用SAS强大的数据管理、分析、报表功能。熟练的SAS用户可以利用SAS/ASSIST快速高效地开发应用程序原型并测试,可以利用SAS/ASSIST自动生成程序代码的功能学习SAS语言的使用,并可以把生成的程序编辑后组合到自己的应用中。,武汉大学计算中心,LOGO,启动SAS/ASSIST,ASSIST窗口的启动方法有二种:用鼠标选择“解
18、决方案”菜单中的“ASSIST”在命令框中输入ASSIST回车,SAS编程序基础,武汉大学计算中心,LOGO,SAS每次启动时会自动指定4个库标记:Work,Sasuser,Sashelp,Sasmap。Sasuser库保存与用户个人设置有关的文件,Sashelp库保存与SAS帮助系统、例子有关的文件。永久文件保存在永久库中,在退出SAS系统时不会自动被删除。,逻辑库和SAS文件,武汉大学计算中心,LOGO,SAS文件是指储存在SAS逻辑库中的成员,SAS的用户文件的主要类型有:SAS数据集 SAS程序 访问一个SAS文件,一定要指明它所在的逻辑库,格式为:逻辑库名.文件名。如在Sasuser
19、库下建立一个名为Mydata的数据集,访问的时候,要用Sasuser.mydata。如果不指明逻辑库名,则表示存储在临时逻辑库WORK中的SAS文件。,逻辑库和SAS文件,武汉大学计算中心,LOGO,2.SAS的名字 SAS的名字(数据集名、变量名、逻辑库名等等)有以下命名规则:1)由英文字母、数字、下划线组成;2)第一个字符必须是字母或下划线;3)不区分大、小写字母。另外,SAS逻辑库名最多用8个字符;数据集和变量的名字最多用32个字符。,逻辑库和SAS文件,武汉大学计算中心,LOGO,3.SAS数据集 SAS的核心是SAS数据集。SAS数据集是SAS文件的一种,一般由以下两部分组成:(1)
20、描述部分 包含该数据集的一般信息,包括:数据集的名字及其成员类型、数据集建立的日期和时间、观测的数目、变量的数目以及数据集中每一个变量的特征信息,包括:Name(变量名)、Type(类型)、Length(长度)、Format(输出格式)、Informat(输入格式)、Label(标签)。(2)数据部分,逻辑库和SAS文件,武汉大学计算中心,LOGO,1.数据步与过程步 SAS程序包括多个步骤和一些控制语句,一般情况下由两种类型的程序步(steps)组成:数据步(DATA steps)和过程步(PROC steps)。有时SAS程序还包括一些全程语句,用以控制贯穿整个SAS程序的某些选项、变量或
21、程序运行的环境。,SAS程序概述,武汉大学计算中心,LOGO,数据步与过程步 数据步通常用于创建SAS数据集,但也可以用于产生特别设计的报表。过程步通常用于分析和处理SAS数据集中的数据,但有时候也可用于创建数据集。一个SAS程序就是由数据步、过程步或两者的任意组合而成。每一个程序步通常由若干语句(statements)构成。,SAS程序概述,武汉大学计算中心,LOGO,数据步语句,SAS语言构成数据步 data 过程步 procSAS语句关键字开始,分号结束SAS表达式常量数字型 12,3.14159,1.5E-8字符型“Lin ming”日期型 15jul2007d日期时间型 15JUL2
22、00714:13:20DT缺失值数字型缺失值用句点表示,武汉大学计算中心,LOGO,数据步语句,SAS表达式变量数字型字符型运算符算术运算符:+,-,*,/,*比较运算符号:=,=,=,=5 and sex=“女”,武汉大学计算中心,LOGO,数据步的工作流程,数据步开始,有未读入的观测值吗?,用数据读入语句读入一个观测值,用其它语句对观测值进行运算或处理,把当前的观测值写入数据集,数据集建立完毕,开始下一个数据步或过程步,Y,N,武汉大学计算中心,LOGO,数据步语句,DATA语句DATA 数据集名(选择项);表明数据步的开始,定义新数据集名常用选项:DROP=变量名表 KEEP=变量名表
23、RENAME=(老变量名=新变量名),武汉大学计算中心,LOGO,数据步语句,INPUT语句INPUT 变量$起始列-末列;INPUT 变量$SAS输入格式;读数据指针的使用行保持符或的使用,武汉大学计算中心,LOGO,数据步语句,注释语句/*sklfjsdkfjsdk slkdjfsldk*/赋值语句变量名=表达式;,武汉大学计算中心,LOGO,数据步语句,IF语句IF 表达式;仅对符合条件的观测值处理或IF 表达式 THEN 语句1;ELSE 语句2;如果THEN后有多句 THEN DO;语句序列1 END;,武汉大学计算中心,LOGO,数据步语句,简单DO语句DO;若干SAS语句END;
24、,武汉大学计算中心,LOGO,数据步语句,循环DO语句DO 变量=初值 TO 终值 BY 增量 while|untill(表达式);END;例DO I=1 TO 8 BY 2;DO I=2 TO 16 BY 2 UNTIL(X/2)Y);DO I=1 TO 10 WHILE(XY);,武汉大学计算中心,LOGO,数据步语句,DO WHILE 语句DO while(表达式);END;例N=0;DO WHUILE(N5);X=N;N=N+1;END;,武汉大学计算中心,LOGO,数据步语句,DO UNTIL 语句DO UNTIL(表达式);END;例N=0;DO UNTIL(N=5);X=N;N=
25、N+1;END;,武汉大学计算中心,LOGO,数据步语句,OUTPUT语句OUTPUT 数据集名;把当前的观测值写入正在建立的数据集中例Libname aa“e:sasdata”;Data classb classg;Set aa.class1;If sex=b then output classb;Else output classg;Run;,武汉大学计算中心,LOGO,1.临时数据集的建立,程序的基本结构DATA 数据集名;INPUT 变量名表;其他数据步语句;CARDS;若干数据行RUN;,武汉大学计算中心,LOGO,1.临时数据集的建立,例1创建一临时数据集class1DATA CL
26、ASS1;INPUT NAME$AGE SEX$HEIGHT WEIGHT BUST;CARDS;刘明 3 男 0.94 13.59 50.4 蔡行 3 男 0.91 14.20 50.0 李敏 4 女 1.39 16.15 51.6 李涛 4 男 1.02 15.44 51.9 夏天 4 男 1.06 15.30 51.0 郭红 5 女 1.01 15.04 51.9 胡月 5 女 1.02 15.07 52.7 程彬 6 女 1.07 17.04 53.7 杨兵 6 男 1.12 18.09 54.1 刘进 6 男 1.14 18.80 53.5 王苗苗 7 女 1.16 19.93 55
27、.5 张思凡 7 女 1.15 18.20 51.4RUN;PROC PRINT;RUN;,武汉大学计算中心,LOGO,2.永久数据集的建立,例2创建一永久数据集classbLIBNAME kk D:aaa;DATA kk.CLASSB;INPUT NAME$AGE SEX$HEIGHT WEIGHT BUST;CARDS;刘明 3 男 0.94 13.59 50.4 蔡行 3 男 0.91 14.20 50.0 李涛 4 男 1.02 15.44 51.9 夏天 4 男 1.06 15.30 51.0 杨兵 6 男 1.12 18.09 54.1 刘进 6 男 1.14 18.80 53.5RUN;PROC PRINT;RUN;,武汉大学计算中心,LOGO,2.永久数据集的建立,例3退出SAS后,再次进入并读取永久数据集classbLIBNAME BB D:aaa;PROC PRINT DATA=BB.CLASSB;RUN;,武汉大学计算中心,LOGO,谢谢!,
链接地址:https://www.31ppt.com/p-5568389.html