概率统计及SAS应用程序.ppt
《概率统计及SAS应用程序.ppt》由会员分享,可在线阅读,更多相关《概率统计及SAS应用程序.ppt(88页珍藏版)》请在三一办公上搜索。
1、2023/6/22,1,研究生应用讲义肖枝洪,2023/6/22,2,Statistical Analysis System 简称为SAS,可用来分析数据和编写报告.它是美国SAS研究所的产品,在国际上被誉为标准软件,在我国深受医学、农林、财经、社会科学、行政管理等众多领域的专业工作者的好评。有关的最新信息,可以查看http:/。采用积木式模块结构,其中的/模块是目前功能最强的多元统计分析程序集,可以做回归分析、聚类分析、判别分析、主成分分析、因子分析、典型相关分析(下学期介绍)以及各种试验设计的方差分析和协方差分析。本讲义围绕SAS的应用,讲述以下六部分内容:()应用基础;()常用语句;()
2、服务过程;()描述性统计程式;()方差分析程式;()回归分析程式;,2023/6/22,3,的显示管理系统,启动计算机,点击SAS图标后,即可进入SAS的显示管理系统.在View中有四个主要的窗口(其他的先不考虑):(1)编辑窗口(program editor):编辑程式和数据文件;(2)日志窗口(log):记录运行情况,显示error信息;(3)输出窗口(output):输出运行的结果;(4)图形窗口(graph):输出图形.点击 View 菜单中的 Program editor、Log、Output、Graph 命令可以进入编辑、日志、输出及图形窗口.按功能键F5、F6、F7也可以进入编辑
3、、日志及输出窗口.,退出SAS有两种方法:(1)点击 File 菜单中的 Exit 命令;(2)点击窗口右上角的。,2023/6/22,4,概率统计及SAS应用教材中的程序,应用SAS计算二项分布的概率,请注意SAS中 probbnml(p,n,k)=P(Xk)=,因此,当n=5,k=3,p=0.2时,应用SAS直接计算PX=3的程序为:data probnml;p=probbnml(0.2,5,3)-probbnml(0.2,5,2);proc print;run;输出的结果为:0.0512。,2023/6/22,5,当n=5,k=4,p=0.8时,应用SAS直接计算P(X=4)+P(x=5
4、)的程序为:data ex;p=1-probbnml(0.8,5,3);proc print;run;输出的结果为:0.73728。,应用SAS直接计算例1.3.1中所求概率的P8X12的程序为:data ex;p=probbnml(0.5,20,12)-probbnml(0.5,20,7);proc print;run;输出的结果为:0.7368240356。,2023/6/22,6,应用SAS中的probnorm(x)近似计算二项分布的概率时,请注意 probnorm(x)=,因此,应用SAS近似计算P8X12的程序为:data ex;p=probnorm(1.12)-probnorm(-
5、1.12);proc print;run;输出的结果为:0.73729.其中1.12=(12+0.5-10)/sqrt(5),2023/6/22,7,2.在SAS中有probnorm(x)函数,用此函数可以求 PXx.当x=1.645,1.96,2.576时,不查标准正态分布的分布函数的函数值表,应用SAS直接计算PXx的程序为data ex;do x=1.645,1.96,2.576;(给x依次赋值,增加赋值后可全部列出的函数值表)p=probnorm(x);put x p;(计算并输出x对应的概率)end;run;输出的结果如下(在Log窗口中显示):1.645 0.9500150945
6、1.96 0.9750021049 2.576 0.9950024677,2023/6/22,8,用下列程序更好:data ex;input x;p=probnorm(x);list;cards;1.645 1.96 2.576;proc print;run;输出的结果如下(在Log窗口中显示):1.645 0.9500150945 1.96 0.9750021049 2.576 0.9950024677,2023/6/22,9,以下是用SAS程序绘制的二维正态分布分布密度函数的示意图。所用的SAS程序为:data ex;do x=-3 to 3 by 0.25;do y=-3 to 3 by
7、 0.25;p=exp(-(x*x+y*y)*5/4+x*y*3/2)/2)/2/3.1416;output;end;end;proc g3d;plot y*x=p;run;,2023/6/22,10,2023/6/22,11,3应用SAS计算标准正态分布的分位数在SAS中有probit(p)函数,用此函数可以求p分位数.SAS程序为data ex;do p=0.025,0.05,0.1,0.9,0.95,0.975;u=probit(p);put u p;end;run;输出的结果如下:-1.959963985 0.025-1.644853627 0.05-1.281551566 0.1 1
8、.2815515655 0.9 1.644853627 0.95 1.9599639845 0.975,2023/6/22,12,用下列程序更好:data ex;input p;u=probit(p);list;cards;0.025 0.05 0.1 0.9 0.95 0.975;proc print;run;输出的结果如下:-1.959963985 0.025-1.644853627 0.05-1.281551566 0.1 1.2815515655 0.9 1.644853627 0.95 1.9599639845 0.975,2023/6/22,13,当=0.10,0.05,0.01时
9、,应用SAS计算双侧分位数的程序为:data ex;do x=0.1,0.05,0.01;p=1-x/2;u=probit(p);put x p u;end;run;输出的结果如下:0.1 0.95 1.644853627 0.05 0.975 1.9599639845 0.01 0.995 2.5758293035,2023/6/22,14,4应用SAS计算卡方分布的分位数在SAS中有cinv(p,df)函数,用此函数可以求p分位数.SAS程序为data ex;do df=4;do p=0.025,0.05,0.1,0.9,0.95,0.975;c=cinv(p,df);put p df c
10、;end;end;run;输出的结果如下:0.025 4 0.4844185571 0.05 4 0.7107230214 0.1 4 1.0636232168 0.9 4 7.7794403397 0.95 4 9.4877290368 0.975 4 11.143286782,2023/6/22,15,用下列程序更好:data ex;input p df;c=cinv(p,df);list;cards;0.025 4 0.05 4 0.1 4 0.9 4 0.95 4 0.975 4;proc print;run;输出的结果如下:0.025 4 0.4844185571 0.05 4 0.
11、7107230214 0.1 4 1.0636232168 0.9 4 7.7794403397 0.95 4 9.4877290368 0.975 4 11.143286782,2023/6/22,16,5应用SAS计算t分布的分位数在SAS中有tinv(p,df)函数,用此函数可以求p分位数.SAS程序为data ex;do df=4;do p=0.025,0.05,0.1,0.9,0.95,0.975;t=tinv(p,df);put p df t;end;end;run;输出的结果如下:0.025 4-2.776445105 0.05 4-2.131846786 0.1 4-1.533
12、206274 0.9 4 1.5332062741 0.95 4 2.1318467863 0.975 4 2.7764451052,2023/6/22,17,6应用SAS计算F分布的分位数在SAS中有finv(p,df1,df2)函数,用此函数可以求p分位数.SAS程序为data ex;do p=0.025,0.05,0.1,0.9,0.95,0.975;do df1=3;df2=4;f=finv(p,df1,df2);put p df1 df2 f;end;end;run;输出的结果如下:0.025 3 4 0.0662208725 0.05 3 4 0.1096830108 0.1 3
13、4 0.1871732255 0.9 3 4 4.1908604389 0.95 3 4 6.5913821164 0.975 3 4 9.9791985322,2023/6/22,18,还可以用下列程序更好:data ex;input p df1 df2;f=finv(p,df1,df2);list;cards;0.025 3 4 0.05 3 4 0.1 3 4 0.9 3 4 0.95 3 4 0.975 3 4;proc print;run;,2023/6/22,19,data probdist;input a b c;probbnml01=probbnml(a,b,c);probch
14、i01=probchi(c,b);probf01=probf(a,b,c);probit01=probit(a);probnorm01=probnorm(a);probt01=probt(a,b);list;cards;0.1 4 3 0.3 5 4 0.4 6 5 0.6 6 4 0.9 8 3;proc print;run;,2023/6/22,20,一般计算data xzh;a=12+13;b=13-12*2;c=sqrt(19*3);d=18*(1/3);e=log10(1000);g=sin(3);/*f=arcsin(1)lack*/x=12.4221/84.7599;cv=0.2
15、0077/2.55;proc print;,2023/6/22,21,矩阵计算data xzhmatrix;proc iml;x=1 2 3 4 5,2 4 7 8 9,3 7 10 15 20,4 8 15 30 20,5 9 20 20 40;g=inv(x);x2=x*x;e=eigval(x);d=eigvec(x);f=trace(x);h=det(x);J=t(x);print x x2;print d g e h f;print J;run;,2023/6/22,22,应用SAS画频率和累计频率直方图,data hist01;input x;cards;45 46 48 51 5
16、1 57 62 64;proc gchart;vbar x/type=pct space=0;run;,2023/6/22,23,data hist01;input x;cards;70 72 94 24 68 57 90 95 93 109 64 58 79 40 118 84 70 99 132 154 100 77 34 68 26 48 87 85 95 123 105 107 55 45 73 109 58 101 134 94 94 62 156 61 84 77 123 135 40 107 79 131 72 66 30 44 141 98 100 90 78 44 50 58
17、 60 76 78 92 101 62 152 97 81 54 98 75 118 130 90 115 136 100 80 69 98 84 25 179 97 76 56 73 43 82 60 68 160 139;proc gchart;vbar x/type=cpct space=0;run;,2023/6/22,24,2023/6/22,25,应用SAS做样本观测值的描述性统计分析,data ex;input x;cards;45 46 48 51 51 57 62 64;proc univariate;run;,输出的结果如下:7.211103=sqrt(364/7)Vari
18、able=XMomentsN 8 Sum Wgts 8Mean 53 Sum 424Std Dev 7.211103 Variance 52Skewness 0.572987 Kurtosis-1.2721USS 22836 CSS 364CV 13.60585 Std Mean 2.54951,2023/6/22,26,2023/6/22,27,Quantiles(Def=5)分位数100%Max 64 99%64 75%Q3 59.5 95%64 50%Med 51 90%64 25%Q1 47 10%45 0%Min 45 5%45 Q3-Q1 12.5 1%45 Range 19 Mo
19、de 51,2023/6/22,28,应用SAS作例2.1.2中样本观测值经过整理后的描述性统计的程序为:data ex;input x f;cards;25 6 50 20 75 29 100 26 125 11 150 6 175 2;proc univariate;var x;freq f;run;,2023/6/22,29,应用SAS作例2.1.3中样本观测值的描述性统计的程序:data xzh;input x y;cards;1.58 180 9.98 28 9.42 25 1.25 117 0.3 165 2.41 175 11.01 40 1.85 160 6.04 120 5.
20、92 80;proc corr cov vaardf=n;run;,2023/6/22,30,输出的结果如下:Covariance Matrix DF=10 X Y X 14.685864-207.220000 Y-207.220000 3453.800000Pearson Correlation Coefficients/Prob|R|under Ho:Rho=0/N=10 X Y X 1.00000-0.92010 0.0 0.0002 Y-0.92010 1.00000 0.0002 0.0,2023/6/22,31,2.3.8 应用SAS 求置信区间,(1)求一个正态总体均值的置信区间
21、SAS程序为data ex;input x;cards;6.6 4.6 5.4 5.8 5.5;proc means mean std clm;proc means mean std clm alpha=0.1;run;,输出的结果如下:Mean Std Dev Lower 95.0%CLM Upper 95.0%CLM5.5800 0.7224957 4.6829031 6.4770969Mean Std Dev Lower 90.0%CLM Upper 90.0%CLM5.5800 0.7224957 4.8911792 6.2688208,2023/6/22,32,(2)求两个正态总体均
22、值差的置信区间SAS程序为:data ex;do a=1 to 2;input n;do i=1 to n;input x;output;end;end;cards;6 2.1 2.35 2.39 2.41 2.44 2.564 2.03 2.28 2.58 2.71;proc anova;class a;model x=a;means a/lsd cldiff;means a/lsd cldiff alpha=0.1;run;,2023/6/22,33,输出的结果如下:Alpha=0.05 Confidence=0.95 df=8 MSE=0.049494 Critical Value of
23、 T=2.30600 Lower Difference Upper Confidence Between Confidence Limit Means Limit-0.35615-0.02500 0.30615Alpha=0.1 Confidence=0.9 df=8 MSE=0.049494 Critical Value of T=1.85955 Lower Difference Upper Confidence Between Confidence Limit Means Limit-0.29204-0.02500 0.24204,2023/6/22,34,应用SAS作总体分布参数的假设检
24、验(1)一个正态总体均值作假设检验的SAS程序 data ex;input x;y=x-1277;cards;1250 1265 1245 1260 1275;proc means mean std t prt;var y;run;,程序运行的结果为:Analysis Variable:Y Mean Std Dev T Prob|T|-18.2000000 11.9373364-3.3717089 0.0280结果中的Prob|T|为服从t分布的随机变量X的绝对值|T|的概率,即P|X|T|.,2023/6/22,35,(2)两个正态总体均值作假设检验的SAS程序 data xzh;do a=
25、1 to 2;do i=1 to 5;input x;output;end;end;cards;800 840 870 920 850900 880 890 890 840;proc ttest cochran;class a;var x;proc print;run;,程序运行的结果为:TTEST PROCEDUREVariable:XA N Mean Std Dev Std Error1 5 856.000000 43.93176527 19.646882702 5 880.000000 23.45207880 10.48808848,2023/6/22,36,Variances T Me
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 概率 统计 SAS 应用程序

链接地址:https://www.31ppt.com/p-5291076.html