《频数统计与柱状》PPT课件.ppt
《《频数统计与柱状》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《频数统计与柱状》PPT课件.ppt(39页珍藏版)》请在三一办公上搜索。
1、Chap2.1,1,第二章 描述性统计量计算,教学要求:使学生掌握描述性统计量计算所需要的 SAS/INSIGHT与分析员应用的菜单系统及编程语句,会用SAS/INSIGHT与分析员应用或编程方法进行频数统计、画条形图/直方图、常用描述性统计量的计算、盒形图和 分布拟合.教学重点:FREQ、UNIVARIATE、MEANS过程步.教学难点:输出结果的解读.教学方法:授课、上机、实例分析教学内容:,数据分析的第一步 通常是频数统计、描述性统计量的计算、作出柱状图或直方图、盒形图来进行初步分析。,Chap2.1,2,教学内容:,第一节 频数统计与柱状图 概述、用INSIGHT作频数统计和条形图、用
2、分析员应用 作频数统计和条形图、用FREQ,GCHART过程步 作频数统计和条形图第二节 常用描述性统计量计算 概述、用INSIGHT计算常用描述性统计量、用分析员应 用计算常用描述性统计量、用UNIVARIATE、MEANS 过程步计算常用描述性统计量第三节 直方图、盒形图和分布拟合 用INSIGHT作分布图形、用分析员应用作分布图形、用 CAPABILITY过程步作分布图形,Chap2.1,3,2.1 频数统计与柱状图,2.1.1 概述2.1.2 用INSIGHT作频数统计和直方图2.1.3 用分析员应用作频数统计和直方图2.1.4 用编程作频数统计和直方图,Chap2.1,4,2.1.1
3、 概述,样本数据集若关心的是总体中每个个体的若干个指标(即SAS数据集中的变量),例如某个学生的姓名(NAME)、性别(SEX)、年龄(AGE)、身高(HIGHT)和体重(WEIGHT)等等,随机抽样后得到一个样本数据集,如表2.1。其中每一行是一个观测,是某个学生的各个指标(变量)的值。把调查数据已存为SAS数据集:exec.Bclass.,表2.1:exec.Bclass纪录的数据,Chap2.1,5,频数统计:用来了解变量都取什么值,取各个值的频数或百分比。,例如,从数据集Bclass中要得到(其中一个变量)年龄的如下统计表:,表2.2:年龄频数表,频数统计给我们的信息:第二列频数表示整
4、个样本数据中,12岁的学生有8个,13岁的学生有7个等等。第三列百分数表示整个样本数据中,12岁的学生占20%,13岁的学生占17.5%等等。85%在12-15岁之间。,Chap2.1,6,柱状图(也称条形图),柱状图常用于两个或多个组某指标(频数或百分数等)大小的比较.在垂直柱状图里,有多个宽度相同的柱并列,对变量取到的每个值,都用一个柱描绘。柱的高度表示频数(或百分数)。从柱的不同高度可以对变量取值的频数分布有一个整体的印象。以下是相应于频数表2.2的柱状图,比频数表更直观。,柱状图,下面通过sas系统的insight,分析员应用及编程三种不同方法作出频数表和柱状图,Chap2.1,7,定
5、义SAS数据库,File Open object Create new library Name:exec(打勾)Enable at startupPath:D:exec OK,以后目录D:exec列为SAS数据库,其中永久SAS数据集在INSIGHT和分析员环境中总是可以直接打开并进行操作。在编辑窗可以不用LIBNAME语句直接利用SAS数据库exec中SAS数据集。例如,Proc print data=exec.bclass;run;,Chap2.1,8,Analyze Distribution(Y),在分布(Distribution(Y)窗中选 AGE Y,SEX Y,Output在弹出
6、的输出(Output)窗中,点击频数表(Frequency Counts)前的小方框使之打勾(表示要输出频数表)OK OK,用INSIGHT作频数统计(p38),2.1.2 用INSIGHT作频数统计和柱状图,计算Bclass中SEX和AGE的频数和百分数.打开数据集后,在下拉菜单选:,希望百分数和频数都是四舍五入的整数时:点击频数表左上角 Format 8.0,Chap2.1,9,SEX和AGE的频数和百分数表,Chap2.1,10,用INSIGHT作柱状图(p36),在INSIGHT环境下打开数据集 exec.Bclass。显示变量SEX(性别)和WEIGHT(体重)的柱状图:,1.Ana
7、lyze Histogram/Bar Chart(Y);弹出Histogram/Bar Chart(Y)窗2.左侧BCLASS框中选变量SEX Y,WEIGHT Y;3.选左下侧OK.,Chap2.1,11,因为WEIGHT是连续型随机变量,软件自动适当分组后作出柱状图。如要改变分组方式,可点击图框左下角的尖头,并在弹出的菜单中选Ticks,再在弹出的刻度(Ticks)窗口中进行设定。如要改为由28到76,每间隔6为一组?连动功能?改变为水平柱状图?,注:对列名型变量刻度位在条形底边的中间,对区间型变量位在条形底边的左端.,Chap2.1,12,2.1.3 用分析员应用作频数统计和柱状图(p3
8、9),用分析员应用作频数统计在分析员应用环境下,要对数据集exec.Bclass统计AGE和SEX的频数。可由以下几步完成:,Statistics Descriptive Frepuency CountsAGE Frequencies,SEX Frequencies.3.OK.,Chap2.1,13,用分析员应用作柱状图(p41),在分析员应用环境下,条形图是频数统计的图形表现。要对数据集exec.Bclass中变量AGE制作水平条形图。可由以下几步完成:Statistics Descriptive Frepuency Count在弹出的单向频数表(1-Way Frequencies)菜单中选
9、:AGE Frequencies.Plots.在弹出菜单的条形图(Bar charts)框中,点击水平(Horizontal)框或垂直框前的方框,使之打勾。OK OK.随即显示的是一份频数统计表。在主画面左侧的树中,点击以Horizontal Bar Chart of AGE(或Vertical Bar Chart of AGE)命名的分支目录立即显示相应的条形图;如点击以Code命名的分支目录立即显示相应的程序。,Chap2.1,14,思考与练习,试用INSIGHT和分析员应用分别输出数据集xuelin中 变量x和group的频数统计表和柱状图.发现了什么问题?,Chap2.1,15,小结,
10、在INSIGHT环境下频数统计菜单过程前两步:Analyze Distribution(Y)在INSIGHT环境下柱状图菜单过程前两步:Analyze Histogram/Bar Chart(Y),在分析员应用环境下频数统计、柱状图菜单过程前三步相同:Statistics Descriptive Frepuency Counts,Chap2.1,16,2.1.4 用编程作频数统计和柱状图(FREQ过程;GCHART过程),FREQ过程(频数过程.可输出频数表,列联表及独立性检验结果):,Proc freq;tables 变量名列;Run;,1.Data=数据集名 若省略,用最近建立的SAS数据
11、集。2.Order=Freq|Data|Internal|Formatted 规定变量水平的记录次序(排列次序)。Order=Freq 表示按频数降序排列,因此最大频数的水 平第一个出现;Order=Data 表示按输入数据集中值的出现次序排列;Order=Internal 表示按变量的值排序;Order=Formatted 表示按变量格式化值的次序。,Proc freq主语句中可使用的选项:,Chap2.1,17,3.Formchar(1,2,7)=字符串,规定用来构造列联表单元的轮廓线和分隔线的字符。字符串的长度为三个字符长,这些字符用来表示(1)垂直线,(2)水平线,(7)水平与垂直的交
12、叉线。若规定 Formchar(1,2,7)=(三个空格)则生成的表格没有轮廓线和分隔线。默认的该选项为 Formchar(1,2,7)=|,4.Page 要求Freq过程每页只输出一张表。,Chap2.1,18,By 语句,使用此语句时,对由BY变量定义的分组观测分别进行频数分析。当使用BY语句时,过程要求数据集已按BY变量排序。,by 变量名;,Proc freq;tables 变量名列;Run;,使用by语句例:对男生和女生分别作年龄的频数表.,Proc sort data=exec.Bclass;by sex;Run;Proc freq data=exec.Bclass;by sex;
13、tables age;Run;,对By变量的每个值作出频数表,即对男生和女生分别作出年龄的频数表,排序过程,Chap2.1,19,-性别=男-The FREQ Procedure 年龄 Cumulative Cumulative AGE Frequency Percent Frequency Percent 12 3 13.64 3 13.64 13 4 18.18 7 31.82 14 7 31.82 14 63.64 15 5 22.73 19 86.36 16 1 4.55 20 90.91 17 2 9.09 22 100.00,-性别=女-The FREQ Procedure 年龄
14、Cumulative Cumulative AGE Frequency Percent Frequency Percent 12 5 27.78 5 27.78 13 3 16.67 8 44.44 14 5 27.78 13 72.22 15 2 11.11 15 83.33 16 2 11.11 17 94.44 17 1 5.56 18 100.00,频数表(单向表),Chap2.1,20,tables 变量名列;,变量名列:列出要输出频数表的变量名,变量名之间要空格.在PROC FREQ 的一次执行中可以包括任意多个tables语句。如果没有tables语句,FREQ过程对数据集中每个
15、变量都生成一个单向频数表。如果需要两个变量的交叉表(列联表),只要在tables语句中用星号*隔开两个变量名。,例如:作数据集Bclass中性别和年龄的列联表:,Tables 语句,Proc freq data=exec.Bclass Formchar(1,2,7)=|;tables sex*age;Run;,第一个变量的值形成表的行,第二个变量的值形成表的列。,Proc freq;tables 变量名列;Run;,Chap2.1,21,The FREQ Procedure Table of SEX by AGE SEX(性别)AGE(年龄)Frequency|Percent|Row Pct|
16、Col Pct|12|13|14|15|16|17|Total-+-+-+-+-+-+-+男|3|4|7|5|1|2|22|7.50|10.00|17.50|12.50|2.50|5.00|55.00|13.64|18.18|31.82|22.73|4.55|9.09|37.50|57.14|58.33|71.43|33.33|66.67|-+-+-+-+-+-+-+女|5|3|5|2|2|1|18|12.50|7.50|12.50|5.00|5.00|2.50|45.00|27.78|16.67|27.78|11.11|11.11|5.56|62.50|42.86|41.67|28.57|6
17、6.67|33.33|-+-+-+-+-+-+-+Total 8 7 12 7 3 3 40 20.00 17.50 30.00 17.50 7.50 7.50 100.00,列联表(双向表),Chap2.1,22,在tables语句的斜杠/后面能使用的选项有三类共24项,其中常用的有:1.规定统计分析的选项 CHISQ不同值取值比率相等检验,独立性的Pearson的检验,对于22表进行Fisher的精确检验2.EXACT对大于22的表进行Fisher的精确检验3.要求进一步信息的选项 EXPECTED在独立性假设下,输出单元频数的期望值4.控制输出的选项 NOCUM不输出单向频数表和列表格式
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 频数统计与柱状 频数 统计 柱状 PPT 课件
链接地址:https://www.31ppt.com/p-4880077.html