欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    统计软件及应用数据步课件.ppt

    • 资源ID:6599366       资源大小:924KB        全文页数:84页
    • 资源格式: PPT        下载积分:15金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要15金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    统计软件及应用数据步课件.ppt

    统计软件SAS及应用,-Focus 编程技术,张媛媛 2010年11月,SAS的主要功能,获取数据管理数据分析数据表示数据应用软件开发,总结:Data步直接输入数据,Libname 数据库名 引擎;,DATA SAS数据集名;语句设定变量属性;INPUT 语句;其他SAS语句;CARDS;RUN;,SAS数据集命名方式,SAS数据集采用两级命名方式定名:,Libname.SAS-filename(库标记.文件名),如:名为 DST2.FISH 的数据集,数据集的名字由英文字母、数字、下划线组成,第一个字母必须是字母或下划线,名字最多只能有8 个字符;另外在命名时不区分大小写。,Example,希望把F:My SAS FilesV8new 这个目录与一个名叫libtest 的数据库联系起来,并且将test 数据集放置在其中。可以在编辑窗口输入如下的程序:libname libtest f:my sas filesv8new;data libtest.test;input code price;cards;600381 18600262 16600252 8600009 10600036;run;,SAS读写规则,读取规则:informat或input语句指定存储规则:length语句指定输出规则:format(数据集)或put语句(日志)指定读取规则主要指定两个方面:开始读取位置结束读取位置或读取字符长度,指定读取规则的方式,开始读取位置:一般情况下是前一个变量结束读取位置的后一列,存在一种特殊情况(:/&)结束读取位置:开始读取非空格数据后遇到的第一个空格所在列作为结束读取位置,注意:1、指定开始列碰见:/&格式修饰符时取最大2、指定读入字符数碰见:/&格式修饰符时取最小,例,input x$y,input x$6 y,input x$9 y,input x$10 y,y=e f,y=fgh,注意,对于字符型变量,length语句的位置很重要,data a;length x$3;input x$4.y$;put x=y=;cards;abcd cdefabc de;run;,data a;input x$4.y$;length x$3;put x=y=;cards;abcd cdefabc de;run;,WARNING:字符变量 x 的长度已经设置。使用 LENGTH 语句作为 DATA STEP 中的第一个语句可以声明字符变量的长度。,DATA步执行阶段,在执行期间,SAS系统执行以下步骤:(除非另有指向)1)PDV中所有的变量值被初始化为缺失值;2)输入缓冲器据input语句的数据需求,读入源数据文件的相应记录行,并写相应的数据字段到PDV;3)每个语句被顺序执行,并可修改PDV形成当前观测;4)数据步语句一遍执行后,PDV中的值写入数据集;*5)PDV中外部变量初始化为确失值,程序流程回到2);6)对数据源文件的每条记录都按上面步骤执行一次;7)重复以上步骤直到外部文件中数据结束。,DATA步的工作流程,数据步开始,有未读入的观测值吗?,用数据读入语句读入一个观测值,用其它语句对观测值进行运算或处理,把当前的观测值写入数据集,数据集建立完毕,开始下一个数据步或过程步,Y,N,Input语句后的单尾符,一个数据步内可以有多条input语句。但是当执行完一条input语句后,一般将放弃缓冲区内现有源数据行,而从源文件中再取一条记录更新缓冲区。若要保持现有源数据行供下一条input使用其数据,则应在input语句的最后加入跟踪符。例:,data tmp1;input x;input y;cards;11 22 3344 55 66;run;,data tmp2;input x;input y;cards;11 22 3344 55 66;run;,data tmp3;input x;input y;cards;11 22 3344 55 66;run;,Input语句后的双尾符,一般情况下,当程序执行到数据步底部后,也会从源数据文件中另取一行记录来更新缓冲区内原有数据。若要缓冲区内原有数据不放弃,使其在数据步的下一循环中仍可用,则应在input语句最后加上跟踪符。例:,data tmp5;input x y;cards;11 22 3344 55 66;run;,data tmp6;input x y;cards;11 22 3344 55 66;run;,data tmp7;input a;input x y;cards;11 2233 44 55 66;run;,data tmp8;input a;input x 1-2 y;if _n_=10 then stop;cards;11 2233 44 55 66;run;,源数据的指针控制,当SAS从数据行中读取数据时,它用指针来跟踪当前数据的位置;指针控制符可为input语句指示数据源中当前数据所在的行、列位置。列指针控制符列指针控制符“+n”表示指针右移n列(n为负则左移n列);列指针控制符“n”表示指针移到第n列(绝对位置);列指针控制符“character-string”表示把指针移到数据行中字符串character-string后第一个非空格列。行指针控制符行指针控制符“#n”表示指针移到第n行;(当一条观测有几行源数据时,起作用)行指针控制符“#(expression)”表示指针移到表达式的值(必须为整数)所指的行。行指针控制符“/”表示指针移到下一行的第一列。,指针控制符用法示例,行指针用法示例:data tmp1;input name:$10.age/score1-score3;cards;zhangsan 1288 98 67lisi 1377 98 86;run;,列指针用法示例1:data tmp2;m=-1;/*左移一列*/input x 1-4+m y 2 id$2.;/*drop m;*/cards;123452468013579;run;,列指针用法示例2:data tmp3;input id$2.age 3-4 size=x;list;cards;0116size=54.230215size=45.661318size=61.01;run;,Cards/Cards4语句,CARDS语句或DATALINES语句告诉SAS系统下面跟着的是数据行。数据行之前用CARDS语句或DATALINES语句。语句格式:CARDS;或DATALINES;数据行 数据行之前用CARDS语句。data;input var1 var2 var3$;cards;16 20 First;,Cards/Cards4语句,数据行中含有分号时,必须用CARDS 4或DATALINES4语句。语句格式:Cards 4;或DATALINES4;数据行;数据行中含有分号时用CARDS4语句。data;input var1$var2$var3$;cards4;A;B(;);,例,data a;input x$y$;put x=y=;cards4;abcd;cdefabc;de;run;,data a;input x$y$;put x=y=;cards4;abcd;cdefabc;de;run;,使用DATA步新建数据集,data SAS-data-set;变量属性设定语句;infile filename option;input 变量输入设定;其他SAS语句;run;,data SAS-data-set;变量属性设定语句;input变量输入设定;其他SAS语句;cards;原始数据;run;,自文本数据文件生成SAS数据集,DATA SAS数据集名;ATTRIB语句设定变量属性;INFILE 文件名 FIRSTOBS=n1 OBS=n2;INPUT 语句;其他SAS语句;RUN;,data CHILD;infile“C:SUNNY例题数据资料CHILD.TXT”;input ID X1$X2 X3 X4;run;,应用举例,应用INFILE语句导入外部数据文件的标准程序 data delinfo(label=退市信息|delist information);format stkcd$6.lstknm$12.lstdt yymmdd10.delistdt yymmdd10.exchflg$1.stktype$1.;informat stkcd$6.lstknm$12.lstdt yymmdd10.delistdt yymmdd10.,exchflg$1.stktype$1.;labelstkcd=股票代码|stock codelstknm=最新股票名称|latest stock namelstdt=股票上市日|list datedelistdt=退市日期|delist dateexchflg=交易所标识|exchange flagstktype=股票类型|stock type;infile d:resdatdelinfo.txt delimiter=09x missover dsd firstobs=2;input stkcd$6.lstknm$12.lstdt yymmdd10.delistdt yymmdd10.exchflg stktype 1.;run;例中,09x是TAB的十六进制表示,这里规定delimiter=09x是不能去掉的,去掉的话就出错了。由于文本数据不规则,须中或:控制变量delistDt.,Infile选项说明,INFILE语句用来定义一个外部数据文件,文件中的数据用INPUT语句读取。外部文件可以是已存在的磁盘文件,也可以是从键盘上输入的数据行。语句格式 INFILE file-specification;file-specification选项说明:EXTERNAL FILE规定一个外部文件的完整路径和文件名。CARDS|CARDS4|DATALINES|DATALINES4选项指明输入数据为CARDS(CARDS4,DATALINES,DATALINES4)后面的数据流,而非来自外部数据文件。,option-list选项说明(部分):,Delimiter=选项应用,data a;infile cards delimiter=,;input x y z;cards;3,6,91,3,58,8,8;例中,要输入的数据用逗号分隔,创建SAS数据集时用选项DELIMITER=,。,数据集a,DSD选项应用,data scores;infile datalines delimiter=,;input test1 test2 test3;datalines;91,87,9597,92,1,1;例中,分隔符为逗号,但第二个观测值的两个相邻分隔符之间还有缺失值,没有DSD选项时,这两个相邻的分隔符组成一个分隔符,于是,输入数据时会出错。,DSD选项应用,上例加上DSD选项,将两个相邻分隔符之间的数作为缺失值处理 data scores;infile datalines delimiter=,DSD;input test1 test2 test3;datalines;91,87,9597,92,1,1;通常情况下,同时加上MISSOVER和 DSD两个选项是良好的编程习惯。,Missover选项应用,data a;input x$y$;put x=y=;cards;abcd cdefabc de;run;,data a;infile cards missover;input x$y$;put x=y=;cards;abcd cdefabc de;run;,SAS数据集的建立,访问外部数据文件,SAS系统访问的外部文件可以分为两类:PC格式的数据文件;流行数据库(DBMS)文件。,常用的访问外部文件的方法,使用Import菜单由文本文件读入,从SAS下拉菜单选择:,在Windows操作系统中,外部文件是指文本文件(格式为.dbf、.xls、.wk1、.wk3等);对一些用户规定格式的文件可提供EFI(External File Interface外部文件界面)。,练习,通过infile语句导入class.txt文件中的第三行以后的所有数据。通过菜单操作导入class.txt文件、fitness.xls文件中的数据。,使用DATA步新建数据集,data SAS-data-set;变量属性设定语句;infile filename option;input 变量输入设定;其他SAS语句;run;,data SAS-data-set;变量属性设定语句;input变量输入设定;其他SAS语句;cards;原始数据;run;,其他SAS语句,SAS表达式数据步中的常用语句,SAS表达式,SAS数据步程序中的计算由SAS表达式完成;SAS表达式通过运算符、括号等,将调用的常量、变量和函数连接起来,得到一个计算结果。,SAS运算符,SAS运算符包括算术、比较和逻辑等运算符。,算术运算符 作用 举例+加法 sum=x+y;-减法 diff=x-y;*乘法 mult=x*y;/除法 divide=x/y;*幂运算 raise=x*y;|字符串拼接 str=str1|str2;,SAS运算符,比较运算符,运算符 符号 意义,逻辑运算符,SAS运算符包括算术、比较和逻辑等运算符。,SAS运算符,运算符IN是一个SAS特有的比较运算符,用来检查某个变量的取值是否在一个给定列表中,比如 prov in(北京,上海,天津,重庆)可以判断变量prov的取值是否为四个直辖市之一。,SAS函数,SAS函数返回由它的参数计算得到的结果,SAS提供了远多于一般程序语言的标准函数,主要包括数学函数、数组函数、字符函数、日期和时间函数、分布密度函数和分布函数、分位数函数、随机数函数、样本统计函数等,它们可以直接用于数据步计算中。,例,SAS函数返回由它的参数计算得到的结果,DATA ABC;INPUT x1 x2 x3 x4;y=sum(of x1,x2,x3,x4);CARDS;1 2 3 4 2 3 4 5 5 6 7 8;RUN;,常用字符函数,TRIM(s)返回去掉字符串s的尾随空格的结果;UPCASE(s)把字符串s中所有小写字母转换为大写字母后的结果;LOWCASE(s)把字符串s中所有大写字母转换为小写字母后的结果;INDEX(s,s1)查找s1在s中出现的位置,找不到时返回0;RANKS(s)字符s的ASCII码值;等等,常用日期和时间函数,MDY(m,d,yr)生成yr年m月d日的SAS日期;YEAR(date)由SAS日期值date得到年;MONTH(date)由SAS日期值date得到月;DAY(date)由SAS日期值date得到日;WEEKDAY(date)由SAS日期值date得到星期几;QTR(date)由SAS日期值date得到季度值;HMS(h,m,s)由小时h、分钟m、秒s生成SAS时间值;DHMS(d,h,m,s)由SAS日期值d、小时h、分钟m、秒s生成SAS时间值;等等,日期常数和函数,日期时间直接作为数字型常数:ddMMMyy D(例如:12JAN96d、14:20t、13JUL1998:14:20:32dt)一些操作日期的函数:DATE()取今天的日期作为SAS日期值,TODAY()-取当日的日期作为SAS日期值,DATETIME()-取当日的日期和时间作为SAS日期时间值,TIME()-取今天的时间作为SAS时间值,HOUR(time|datetime)由SAS的时间或日期时间得到小时,MINUTE(time|datetime)-由SAS的时间或日期时间得到分钟,SECOND(time|datetime)-由SAS的时间或日期时间得到秒钟,日期常数和函数,YEAR(date)-由SAS日期date得到年,MONTH(date)-由SAS日期date得到月,DAY(date)-由SAS日期date得到日,WEEKDAY(date)-由SAS日期date得到星期几(周日)QTR(date)-由SAS日期date得到季度值,MDY(month,day,year)-生成year年month月day日的日期值,HMS(hour,minute,second)-由小时hour,分钟minute,秒second生成时间值,DHMS(date,hour,minute,second)-生成日期时间值,DATEPART(datetime)-取SAS日期时时间值datetime的日期部分,,日期常数和函数,INTNX(interval,from,n)-计算从from开始经过n个间隔后的SAS日期。其中interval可以取YEAR、QTR、MONTH、WEEK、DAY等。比如,INTNX(MONTH,16Dec1997d,3)结果为1998年3月1日。注意它总是返回一个周期的开始值。INTCK(interval,from,to)-计算从日期from到日期to中间经过的interval间隔的个数,其中interval取MONTH等.比如,INTCK(YEAR,31Dec1996d,1Jan1998d)计算1996年12月31日到1998年1月1日经过的年间隔的个数,结果得2,尽管这两个日期之间实际只隔1年。,常用数学函数,ABS(x)绝对值函数,对x取绝对值;MAX(x1,x2,xn)最大值函数,求所有自变量中的最大值;MIN(x1,x2,xn)最小值函数,求所有自变量中的最小值;MOD(x,y)余数函数,求x除以y的余数;SQRT(x)平方根函数,求x的平方根;ROUND(x,eps)舍入函数,求x按eps指定精度四舍五入后的结果;INT(x)取整函数,对x取整数部分;LOG(x)自然对数函数,求x的整数部分;EXP(x)指数函数,求x的指数函数ex;SIN(x),COS(x),TAN(x)三角函数,分别求x的正弦、余弦、正切函数;ARSIN(x),ARCOS(x),ARTAN(x)反三角函数,分别求x的反正弦、反余弦、反正切函数;等等,分布函数和分布密度函数,SAS语言作为一种统计计算语言,它提供了多种概率分布的有关函数。其中分布密度、概率、累积分布函数等可以通过几种统一的格式调用,格式为,分布函数值=CDF(分布,x);密度值=PDF(分布,x);概率值=PMF(分布,x);对数密度值=LOGPDF(分布,x);对数概率值=LOGPMF(分布,x);,分布函数和分布密度函数,CDF计算由分布指定的某种分布的分布函数,PDF计算分布密度函数值,PMF计算离散分布的分布概率,LOGPDF为PDF的自然对数,LOGPMF为PMF的自然对数.函数在自变量x处计算,表示可选的参数表。分布类型取值可以为:BERNOULLI,BETA,BINOMIAL,CAUCHY,CHISQUARED,EXPONENTIAL,F,GAMMA,GEOMETRIC,HYPERGEOMETRIC,LAPLACE,LOGISTIC,LOGNORMAL,NEGBINOMIAL,NORMAL或GAUSSIAN,PARETO,POISSON,T,UNIFORM,WALD 或 IGAUSS,and WEIBULL。可以只写前四个字母。,分布函数和分布密度函数,例如,PDF(NORMAL,1.96)计算标准正态分布在1.96处的密度值(0.05844);CDF(NORMAL,1.96)计算标准正态分布在1.96处的分布函数值(0.975)PMF(NORMAL,1.96)=PDF(NORMAL,1.96)即PMF对连续型分布即为PDF。除了用上述统一的格式调用外,SAS系统还单独提供了用于计算常用分布的密度、分布函数。,分布函数和分布密度函数,PROBNORM(x):计算标准正态的分布函数.即计算服从标准正态分布的随机变量U小于等于给定x的概率(PU=x).PROBCHI(x,df,nc):计算自由度为df,非中心参数为nc的卡方分布的分布函数.如果nc没有规定或取为0,那么被计算的就是中心卡方分布.自由度df允许不是整数.例如:p=1-probchi(31.264,11);的结果为1-0.999=0.001.,分布函数和分布密度函数,PROBGAM(x,a):计算形状参数a(a0)的伽马分布的分布函数.例如:p=probgam(7.5,5.2);的结果为0.84885.PROBBETA(x,a,b):计算贝塔分布的分布函数(其中:,,).例如:p=probbeta(0.75,4,2.5);的结果为0.7467.PROBF(x,ndf,ddf,nc):计算F分布分布函数(其中ndf为分子自由度,ddf为分母自由度,nc是非中心参数).当分布是中心F分布时,取nc=0或不规定这项自变量.自由度可以是非整数.例如:p=1probf(3.32,2,30);的结果是0.04983.,分布函数和分布密度函数,PROBT(x,df,nc):计算t分布分布函数(其中df为自由度,nc为非中心参数).若参数nc没有规定或取为0,那么被计算的就是中心t分布.自由度df允许非整数.PROBBNML(p,n,m)(其中:0p1,n1,0mn):计算二项分布的概率分布函数.POISSON(lambda,n)(其中 lambda,n):计算柏松分布的概率分布函数.PROBNEGB(p,n,m)(其中0p1,n0,m0):计算负二项分布的概率分布函数.,分布函数和分布密度函数,PROBHYPR(nn,k,n,x,r)(其中nn1,0knn,0nnn,max(0,k+nnn)xmin(k,n):计算超几何分布的概率分布函数.设nn个产品中有K个不合格品,抽取n个样品,其中不合格品数小于等于x的概率为此函数值。可选参数r是不匀率,缺省为1,r代表抽到不合格品的概率是抽到合格品概率的多少倍。PROBBNRM(x,y,r)标准二元正态分布的分布函数,r为相关系数。,分位数函数,设连续型随机变量X的分布函数为F(x),对给定的p(0p1),若有xp使得F(xp)=p,则称xp为随机变量X的分位数(或称分布F(x)的p分位数).SAS系统提供计算六种常见连续分布分位数的函数.CINV(p,df,nc)(其中 0p1,自由度df0,非中心参数nc0)计算卡方分布的分位数.例如:data;q1=cinv(0.95,3);put q1=q1;q2=cinv(0.95,3.5,4.5);put q2=;run;结果是q1=7.8147,q2=17.505(在LOG窗口显示).,分位数函数,BETAINV(p,a,b)(其中:0p1,a0,b0):计算贝塔分布的分位数.例如:x=betainv(0.001,2,4);的结果为0.0101.FINV(p,ndf,ddf,nc)(其中 0p1,分子自由度ndf0,分母自由度ddf0,非中心参数nc0):计算F分布的分位数.例如以下DATA步计算的结果为q1=4.1028,q2=7.5838.data _null_;q1=finv(0.95,2,10);put q1=;q2=finv(0.95,2,10,3.2);put q2=;run;,分位数函数,TINV(p,df,nc)(其中0p1,自由度df0):计算t分布的分位数.若nc没有规定或取nc=0,那么计算的就是中心t分布的分位数.若nc的绝对值很大,使用的算法可能失败.这种情况函数得到一个缺失值.PROBIT(p)(0p1):计算标准正态分布的分位数.它是概率函数PROBNORM的逆函数.如果随机变量XN(0,1),则 PXprobit(z)=z,这个函数产生的结果在5和5之间.GAMINV(p,a)(其中:0p1,a0):计算伽马分布的分位数.例如:x=gaminv(0.75,3.5);的结果为4.51857.,样本统计函数,设有一组观测数据:x1,x2,xn(存放在变量X1Xn或X、Y、中).SAS系统为我们提供一类函数(共15个),用于计算这组样本值的有关统计量.这类函数要求自变量是数值.它们是:均值:MEAN(of x1-xn)或MEAN(x,y,z,).例如 x=mean(2,6);结果为4.x=mean(1,2,3,2);结果为2.最大值:MAX(of x1-xn)或 MAX(x,y,).最小值:MIN(of x1-xn)或 MIN(x,y,).,样本统计函数,非缺失数据的个数:N(of x1-xn)或 N(x,y,).缺失数据的个数:NMISS(of x1-xn)或 NMISS(x1,x2,).求和:SUM(of x1-xn)或 SUM(x1,x2,).方差:VAR(of x1-xn)或 VAR(x1,x2,).标准差:STD(of x1-xn)或 STD(x1,x2,).例如 x=std(2,6);和x=std(2,6);的结果都是2.828427.x=std(2,4,6,3,1);的结果为1.923538.,样本统计函数,标准误:STDERR(of x1-xn)或STDERR(x1,x2,).例如:x=stderr(2,6,3,4);或 x=stderr(2,6,3,4,);的结果都是0.8539126。变异系数:CV(of x1-xn)或 CV(x1,x2,).极差:RANGE(of x1-xn)或RANGE(x1,x2,).偏差平方和(校正平方和):CSS(of x1-xn)或 CSS(x1,x2,).该函数计算非缺失自变量关于均值的偏差平方和.未校正的平方和:USS(of x1-xn)或 USS(x1,x2,).该函数计算非缺失自变量的(未校正)平方和.,样本统计函数,(14)偏斜度:SKEWNESS(of x1-xn)或SKEWNESS(x1,x2,).该函数计算非缺失自变量的偏斜度.(15)峰度:KURTOSIS(of x1-xn)或KURTOSIS(x1,x2,).该函数产生非缺失自变量的峰度统计量.它要求至少有4个非缺失自变量.(16)ORDINAL(k,x1,x2,xn)返回数值列表x1,x2,xn中第k小的值.,其他函数,LAGn(x)返回该自变量x前n条观测(记录)中该变量的值.DIFn(x)得到该自变量x的值减去前n条观测(记录)中该变量的值.例如数据集AIR:,date airJAN49 112 FEB49 118 MAR49 132 DEC49 118 JAN50 115 FEB50 126 MAR50 141.,其他函数,(1)计算每月乘客数较上月增加的百分数;(2)计算逐月乘客数较去年同期增加的百分数,Data lagdif;set dst.air;pct1=dif(air)/lag(air);pct2=dif12(air)/lag12(air);run;,其它函数,SAS函数,练习,1.计算标准正态分布在x=-3,-2,-1,0,1,2,3时的分布函数F(x)和密度函数(x)的值;2.设随机变量t(n),计算t分布的分位数tp(n),其中n=1,5,10,20;p=0.10,0.90,0.95,0.975;3.当日期值date=14JUL2007d时,试问这一天是星期几?,DATA步中常用语句,DATA语句PUT语句输出语句SET语句读取观测语句ATTRIB语句设定变量属性赋值语句计算SAS表达式,给变量赋值DROP语句删除变量语句KEEP语句保留变量语句IF语句条件语句DO-END语句循环语句DELETE语句删除语句OUTPUT语句输出到数据集语句COMMENT语句注释语句ARRAY语句数组语句,数据步中的常用语句,DATA语句:用来建立一个或多个新的数据集,数据步中的常用语句,例数据集选项举例。data new(drop=var1);/*去掉数据集new中变量var1*/data new(keep=_numeric_);/*保留数据集new中所有数值变量*/data new(label=股本变动历史);/*规定数据集new标签名为”股本变动历史”*/data new(rename=(var1=u var2=v);/*将数据集new中变量var1和var2更名为u和v*/data book(index=(author subject);/*数据集book对变量author subject建立索引*/,数据步中的常用语句,_null_ 一般和PUT语句一起用。由PUT输出结果,只输出到LOG窗口,不会产生SAS数据集。例 不产生数据集。data _null_;x=exp(5);y=log(10);put x=y=;run;,数据步中的常用语句,PUT语句:用来显示输出结果,输出结果直接显示在LOG窗口中,例,数据步中的常用语句,DATA abc;X=0.5;Y=sin(x);PUT“Sine funtion value of”x“is”y;PUT x=y=;PUT x 10-20.6 y 30-40.6;RUN;,数据步中的常用语句,SET语句:把一个已有数据集复制到一个新数据集,同时还可以进行修改,数据步中的常用语句,ATTRIB语句:用来指定变量的类型、标签、长度、输入输出格式等变量属性,例,数据步中的常用语句,DATA sales;ATTRIB name LABEL=“姓名”LENGTH=$10 date LABEL=“日期”FORMAT=yymmdd10.INFORMAT=yymmdd10.amount LABEL=“金额”FORMAT=10.2;INPUT name$1-10 date amount;Cards;张鹏 2003/03/18 2000 李志明 2003/05/23 1500 王敏 2003/09/01 3000;RUN;PROC PRINT NOOBS LABEL;RUN;,数据步中的常用语句,赋值语句:用于计算一个SAS表达式,并将表达式的值赋给变量,数据步中的常用语句,条件语句的一般形式为:,IF 条件表达式 THEN 可执行语句;ELSE 可执行语句(不是必须的);,条件表达式主要包含操作数和操作符:,数据步中的常用语句,DO-END语句:在DO后面直到END语句之前的所有语句作为一个单元(称为一个DO组)被执行,任意多个DO组能够被嵌套执行。,;If X5 then do;Y=X10;put X=Y=;end;Z=X+3;;,数据步中的常用语句,data _null_;do I=1 to 6 by 2;put I=;end;run;,循环 DO 语句使DO和END之间的语句根据循环控制变量的值重复被执行,DO 循环控制变量=初值 TO 终值 BY 步长;其它可执行程序;END;,数据步中的常用语句,data males females;set child;if x1=m then output males;else output females;run;,OUTPUT语句使SAS系统输出当前的观测或DO组中的变量到正被创建的数据集中,数据步中的常用语句,COMMENT语句为注释语句,可放在SAS过程的任何地方用来说明这个过程的目的,如解释说明程序中的一些独特的程序段,或介绍整个程序等。,*循环 DO 语句;(或:/*循环 DO 语句*/)data _null_;do I=1 to 6 by 2;put I=;end;run;,数据步中的常用语句,数组:SAS过程中使用同一个名字称呼,用下标来区分的合在一起的同为数值型或同为字符型的一组变量,数值型数组,ARRAY 数组名(维数说明)数组元素名列表(初始值表);,数据步中的常用语句,字符型数组,ARRAY 数组名(维数说明)$元素长度说明 数组元素名列表(初始值表);,数组:SAS过程中使用同一个名字称呼,用下标来区分的合在一起的同为数值型或同为字符型的一组变量,数据步中的常用语句,DATA abc;ARRAY x(10);DO i=1 to 1000;DO j=1 to 10;x(j)=normal(0);END;OUTPUT;END;DROP i j;RUN;DATA new;SET abc(obs=100 keep=x1 x2);PROC PRINT;RUN;,正态分布随机数函数,The End,

    注意事项

    本文(统计软件及应用数据步课件.ppt)为本站会员(牧羊曲112)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开