数据分析(SAS描述性统计分析过程).ppt
《数据分析(SAS描述性统计分析过程).ppt》由会员分享,可在线阅读,更多相关《数据分析(SAS描述性统计分析过程).ppt(33页珍藏版)》请在三一办公上搜索。
1、数据分析,SAS软件,描述性统计分析过程,信息学院 张建新2010.3-6.,几种描述性统计分析的SAS过程和作图过程,proc means,proc univariate proc corr,proc plot/proc gplot proc capability,proc means(1)Means过程的语句格式Means过程的主要控制语句如下:proc means 输入数据集名;,var,变量列表;,class 变量列表;,byfreq,变量列表;变量;,weight 变量;,id,变量列表;,output;run;,proc means(2),var语句规定要求计算简单描述性统计量的数
2、值变量的次序。,by语句按by语句定义的变量进行分组计算其相应的简单统计量,要求输入数据集已按by变量排序。class语句与by语句一样,可用class变量定义观测组,分别计算各组观测的描述统计量。输出格式与by不同且事先不需要按class变量排序。freq语句指定一个数值型的freq变量,它的值表示输入数据集中相应观测出现的频数。,weight语句规定一个weight变量,它的值表示相应观测的权数。,id语句在输出数据集中增加一个或几个附加变量,目的在于识别输出数据集里的观测。其值为生成这个观测的输入数据集中相应观测组里id变量具有的最大值。,n,t,cv,proc means(3)proc
3、 means语句中可用的统计量关键字,统计量名称,含义,统计量名称 含义,未丢失的观测个数,mode,众数,出现频数最高的数,nmissmeanstderrsumstdvarusscssskewnesskurtosis,丢失的观测个数算术平均均值的标准误差加权和标准偏差方差变异系数的百分数加权平方和关于均值偏差的加权平方和对称性的度量偏度对尾部陡平的度量峰度,sumwgtmaxminrangemedianprtclmlclmuclm,权数和最大值最小值极差,maxmin中间值总体均值等于0的t统计量t分布的双尾p值置信度上限和下限置信度下限置信度上限,proc means(4),output语
4、句中的选项。,输出数据集名。,统计量关键字=变量名列表规定在输出数据集中要包含的统计量并规定这些统计量在新数据集中的变量名。means过程对output语句的次数没有限制,可以使用几个output语句来创建内容不同的多个数据集。,N,proc means(5)SAS程序data examp1;input x;cards;70.4 72.0 76.5 74.3 76.5 77.6 67.3 72.0 75.0 74.373.5 79.5 73.5 74.7 65.0 76.5 81.6 75.4 72.7 72.767.2 76.5 72.7 70.4 77.2 68.8 67.3 67.3 6
5、7.3 72.775.8 73.5 75.0 72.7 73.5 73.5 72.7 81.6 70.3 74.373.5 79.5 70.4 76.5 72.7 77.2 84.3 75.0 76.5 70.4;proc means data=examp1 n mean cv skewness kurtosis range median;var x;run;输出,The MEANS Procedure,Analysis Variable:x,Mean,Variation,Skewness,Kurtosis,Range,Median,50 73.7460000 5.4083794 0.1540
6、111 0.3581179 19.3000000,73.5000000,proc univariate(1),单变量统计分析,对一组单指标实验数据进行分析常采用两种方法:,图示法包括茎叶图、盒型图和正态概率,图。,描述统计量包括矩、分位数、极端值和,頻数分布表。,proc univariate(2)Univariate过程的主要控制语句如下:proc univariate 输入数据集名;,varbyfreqweightid,变量列表变量列表变量;变量;变量列表,;,output;run;,proc univariate(3)Univariate过程的主要控制语句如下:proc univaria
7、te 输入数据集名;,varbyfreqweightid,变量列表变量列表变量;变量;变量列表,;,output;run;,教材1.1例题 examp1_1(SAS程序),data examp1_1;input x;cards;,74.3 78.8 68.8 78.0 70.4 80.5 80.5 69.7 71.2 73.579.5 75.6 75.0 78.8 72.0 72.0 72.0 74.3 71.2 72.075.0 73.5 78.8 74.3 75.8 65.0 74.3 71.2 69.7 68.073.5 75.0 72.0 64.3 75.8 80.3 69.7 74.
8、3 73.5 73.575.8 75.8 68.8 76.5 70.4 71.2 81.2 75.0 70.4 68.070.4 72.0 76.5 74.3 76.5 77.6 67.3 72.0 75.0 74.373.5 79.5 73.5 74.7 65.0 76.5 81.6 75.4 72.7 72.767.2 76.5 72.7 70.4 77.2 68.8 67.3 67.3 67.3 72.775.8 73.5 75.0 72.7 73.5 73.5 72.7 81.6 70.3 74.373.5 79.5 70.4 76.5 72.7 77.2 84.3 75.0 76.5
9、 70.4;,proc univariate data=examp1_1;var x;run;,教材1.1例题 examp1_1(SAS结果1)The UNIVARIATE ProcedureVariable:xMoments,NMeanStd DeviationSkewness,100 Sum Weights73.66 Sum Observations3.94008153 Variance0.06007521 Kurtosis,100736615.52424240.03386864,Uncorrected SS,544116.46 Corrected SS,1536.9,Coeff Vari
10、ation 5.34901103 Std Error MeanBasic Statistical Measures,0.39400815,Location,Variability,Mean 73.66000 Std DeviationMedian 73.50000 VarianceMode 73.50000 Range,3.9400815.5242420.00000,Interquartile Range,4.60000,教材1.1例题 examp1_1(SAS结果2)The UNIVARIATE ProcedureQuantiles(Definition 5),Quantile100%Max
11、99%95%90%75%Q3,Estimate84.3082.9580.5079.1575.80,50%Median25%Q110%,73.5071.2068.40,5%1%0%Min,67.3064.6564.30,proc capability(能力分析过程),PROC CAPABILITY is designed for processcapability analysis,including:,Histograms(直方图)and comparative histograms.Cumulative distribution function plots(cdf plots)(累积分布函
12、数).,Quantile-quantile plots(Q-Q plots),probabilityplots,and probability-probability plots(P-P plots).These plots facilitate the comparison of a datadistribution with various theoretical distributions.Goodness-of-fit(拟合优度)tests for a variety ofdistributions including the normal.,Statistical intervals
13、(prediction,tolerance,andconfidence intervals)for a normal population.,教材1.2例题 examp1_4(SAS程序),data examp1_4;input x;cards;,74.3 78.8 68.8 78.0 70.4 80.5 80.5 69.7 71.2 73.579.5 75.6 75.0 78.8 72.0 72.0 72.0 74.3 71.2 72.075.0 73.5 78.8 74.3 75.8 65.0 74.3 71.2 69.7 68.073.5 75.0 72.0 64.3 75.8 80.3
14、 69.7 74.3 73.5 73.575.8 75.8 68.8 76.5 70.4 71.2 81.2 75.0 70.4 68.070.4 72.0 76.5 74.3 76.5 77.6 67.3 72.0 75.0 74.373.5 79.5 73.5 74.7 65.0 76.5 81.6 75.4 72.7 72.767.2 76.5 72.7 70.4 77.2 68.8 67.3 67.3 67.3 72.775.8 73.5 75.0 72.7 73.5 73.5 72.7 81.6 70.3 74.373.5 79.5 70.4 76.5 72.7 77.2 84.3
15、75.0 76.5 70.4;,proc capability data=examp1_4;,histogram x/normal(mu=est sigma=est);cdfplot/normal(mu=est sigma=est);qqplot x/normal(mu=est sigma=est);run;,教材1.2例题 examp1_4(SAS结果)The CAPABILITY ProcedureFitted Normal Distribution for xParameters for Normal DistributionParameter Symbol Estimate,Mean,
16、Mu,73.66,Std Dev Sigma 3.940082Quantiles for Normal Distribution-Quantile-Percent Observed Estimated1.0 64.6500 64.49405.0 67.3000 67.179110.0 68.4000 68.610625.0 71.2000 71.002550.0 73.5000 73.660075.0 75.8000 76.317590.0 79.1500 78.709495.0 80.5000 80.140999.0 82.9500 82.8260,教材1.2例题 examp1_4(SAS直
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 分析 SAS 描述 统计分析 过程

链接地址:https://www.31ppt.com/p-6050159.html