SAS 9.1.3 基础及其程序员认证考试介绍(ppt).ppt
SAS 9.1.3 基础及其程序员认证考试介绍,李晓煦2006/10/07香港中文大学教育心理系,Statistical Analysis System(SAS),作为统计软件的SAS专业的统计处理程序(Proc)强大的数据概览功能:图形界面统计,制作图、表作为关系数据库平台的SASStructured Query Language(Proc SQL)数据库操作配置绝大多数流行数据库平台引擎(engine)强大的输入输出格式编程(input/put)作为另类编程语言的SAS(Data)数据步编程;Proc IML 矩阵编程;%Macro宏编程(对Data/Proc 代码的再编程),谁需要学SAS,期望到产业界(比如药品与食品产业)的应用统计部门就业。竞争北美外企或者政府部门需要分析数据、汇报图表的职位大规模数据库上的统计工作、数据挖掘工作统计研究中高强度的模拟运算,谁不需要SAS,要处理的数据样本量小于3000,变量个数小于50。(Excel,OpenOffice的Calc)通过图形界面作常见的统计检验(Excel,Eview,SPSS)研究统计算法的实现,希望自己可以修改程序中的代码(R/Splus),如何获得SAS软件,通过学校或者单位统一购买。在美国,不同的大学与SAS有自己的谈判价格,可以低到每个学生若干年度20美元。国内的价格谈判要联系此外,每位计划在自己的教学中用到SAS系统的高校教师可以申请一套免费的SAS学习版。详见网址:http:/,中国大陆的SAS证书考试,从http:/国际站点(不点网站首页上的中国)预约。绝大多数省会城市有考点,基本上每个工作日都可以机考。目前初级和高级考试都是115USD(信用卡付款)。对高校师生,06年内的优惠价为77.05USD,需要提前传真(附电子邮件地址)一份学生证或者工作证明到+49 6221 416 7 313,或者用电子邮件发送扫描档案到SAS.Institute.EMEA.C对方确认后,会回复一个优惠密码,预约考试时填写。,考试培训班的成本,官方北京面授培训 10000 RMB*折扣(不推荐)官方在线自学培训 300USD*折扣(不推荐)加拿大非官方面授培训班(?)官方在线模考 50USD*折扣自学(推荐)注意:证书考试不考统计应用只考编程基础,大多数教材的重点是统计应用,证书在有些时候只是锦上添花,成绩单上有SAS这门课,成绩很好,开成绩单的学校或者培训机构卓有声誉写过用SAS作研究工具的学术论文,在业内认可的学术刊物上发表统计内行参与的面试阶段而非初选阶段,SAS产品架构提要,SAS/BASEdata;run;proc;run;proc sql;quit;SAS/INSIGHT 图形界面的统计分析SolutionsAnalysisInteractive Data Analysis选择数据库表格;从图上的点可以回访到数据纪录SAS/GRAPHSSAS/STAT60多个各个统计领域的处理程序(proc)SAS/IMLproc iml;quit;,SAS帮助的架构,树型架构(Overview;Get start;Examples 索引搜索书签页面前后翻页;定位到树型架构,SAS帮助中最有帮助的部分,Examples树型目录Learning to Use SASSample SAS Programs右边的页面链接,SAS语言的架构,Command Statement Step Macro Data;run;Proc;run;Proc IML;quit;Proc GPlot;quit;Proc SQL;quit;%Macro,第一章SAS初阶的补充,SAS 9(2002-2003发布)界面略有变化,对中文和unicode提供了全面的支持SAS 9 主要帮助文档仍然是英文,但已经有越来越多的入门帮助被翻译,如何中止正在运行的SAS代码,程序逻辑中出现死循环(Data步用point=参数却没有用Stop;)程序错误地输入不匹配的引号()(“),SAS会一直等待另一半引号输入,预览上百个变量的DataSet的诀窍,图形容易概览少数变量的大量样本,却不容易概览大量变量、即使样本不多。每次只能集中预览少数变量用ctrl键选择多列把关心的列集中到表头,保存为网页、用Excel看数据,在数据集的图标上点右键,就有选项Save as HTML和View in Excel,第二章SAS语言与数据管理补充,两级注释*;/*/*/*/字符串自动定长度的陷阱LENGTH var_string$12;/*第一句*/大数据集上的代码测试large_dataset(firstobs=10000 obs=10005)Proc sql outobs=10 inobs=5;,如何debug数据步,E _ALL_B 行号W 变量名D B 行号D W 变量名 G,http:/tours(drop=type)/debug;,永远别忘了看Log窗口,不要把Editor窗口和Output窗口最大化,留一条边给Log窗口红字提示错误绿字提示警告,一个坏编程习惯的隐患,测试阶段,永远不要写现有dataset同名的数据步Data Dateset_A;set Dataset_A;/*一旦有错,Dataset_A不可恢复*/Run;,第三章SAS过程初步的补充,强大的ods体系HTMLListingOutputXML、rtf、printer,HLML格式的显示,ODS html;ODS html close;报告输出为html网页,表格方便粘贴到excel中更复杂的功能:在报告图和表格之间设置网络链接;嵌入HTML元素,ODS Output 用法,ods trace on;/*在Log窗口记录输出的表格名*/ods output 输出的表格名=some_dataset;,其他补充,%Macro语言能做什么?%Macro语言常见陷阱%IF(%Eval(5/2)2)%THEN%IF(%SYSEVALF(5/2)2)%THEN%Let A=1.1,2.1,3.4;%Scan(,SAS中的结构方程和多层分析,结构方程 Proc CALIS多层分析 Proc MixedSinger,J.D.(1998),Using SAS PROC MIXED to fit multilevel models,hierarchical models,and individual growth models,Journal of Educational and Behavioral Statistics,24(4).323-355.作者主页http:/www.gse.harvard.edu/faculty/singer/提供了pdf全文下载,但要求下载的读者留一个反馈电子邮件。摘一段主页上对这份资料的简介:It is written as a step-by-step tutorial that shows how to use SAS to fit the two most common multilevel models:(1)two-level models,designed for data on individuals nested within naturally occuring hierarchies(e.g.,students within classes)and(2)individual growth models,designed for exploring longitudinal data(on individuals)over time.The conclusion provides code for three level models and an appendix provides code for working with multilevel data in SAS.,End欢迎提问与讨论,