统计分析软件基础教程-Insight的数据探索功能.ppt
《统计分析软件基础教程-Insight的数据探索功能.ppt》由会员分享,可在线阅读,更多相关《统计分析软件基础教程-Insight的数据探索功能.ppt(89页珍藏版)》请在三一办公上搜索。
1、SAS/Insight的数据探索功能,Page2,掌握 SAS/Insight的操作掌握SAS/Insight的数据管理掌握SAS/Insight的数据探索,内容与要求,Page3,SAS菜单系统简介,1,Insight的数据管理功能,2,Insight的其他功能,4,Insight的数据探索功能,3,Page4,SAS菜单系统简介,在SAS系统统计分析功能的使用中,除通过编程方式外,对常用的分析功能SAS还提供简便的菜单系统,使得用户不用编程就可以方便地享用SAS的许多深入的统计分析功能.目前已提供的菜单系统有:SAS/Insight:是一个进行探索性的交互式数据分析的菜单系统.SAS/ST
2、ATAnalyst Application:是一个为分析员设计的菜单系统.SAS/STATMarketing Research(市场调查):是一个为市场调查数据进行较深入的分析而开发的一个菜单系统.,Page5,SAS/QC SQC:(质量控制):是为企业使用各种质量控制方法而提供的菜单系统.SAS/QC(X)ADX:是为安排各种试验和获得数据后进行分析的菜单系统.SAS/ETS 时间序列预报系统(FORECAST):是在运用时间序列分析中为各种建模和预测功能而开发的菜单系统.与统计分析有关的菜单系统还有 向导式数据分析(LAB);投资分析;企业数据挖掘;排队仿真等等,Page6,SAS/In
3、sight是一个交互式的数据探索和分析的工具。它将统计方法与交互式的图形显示结合在一起,随时为用户提供数据、图形和分析结果三方面的内容,便于用户发现异常数据及包含在数据中的模式或规律,探索性地使用各种统计分析方法并观察分析结果。它为用户提供一种全新的使用统计分析方法的环境。,Insight的数据管理功能,Page7,进入SAS/Insight的几种方法:(1)在命令框键入命令 Insight,(2)用下拉菜单 解决方案(Solutions)分析(Analysis)交互式数据分析(Interactive Data Analysis),(3)提交 Proc Insight;(4)建立Insight
4、的图标,用图标启动.,进入SAS/Insight,Page8,Page9,Insight软件提供数据探索和分析中很广泛的一些方法.在Insight环境下的主菜单包括文件File,编辑Edit,分析Analyze,表Tables,图形Graphs,曲线Curves,变量Vars和帮助Help栏目,这些栏目提供Insight的功能.File栏目下提供打开数据集,存贮数据集、分析结果的表格和图形的管理.Edit栏目下提供对打开数据集中的变量、观测进行增删,设定数据显示格式和窗口管理 功能.,SAS/Insight的功能,Page10,Analyze栏目下提供分析和作图的功能.分析功能包括分布的拟合检
5、验、线性模型(含回归分析、方差分析Logistic回归等)、多变量分析三大类.Tables栏目下提供显示分析结果的各种表格功能.Graphs栏目下提供生成与分析有关的各种图形,包括直方图、盒形图、马赛克(mosaic)图、线图和三维旋转图等.Curves栏目下提供与分析有关的各种曲线.包括拟合的分布密度函数和经验累计分布函数图、分位数-分位数图(Q-Q图)等.Vars栏目下提供由分析结果形成新的变量.,Page11,SAS/Insight的帮助信息提供十分广泛的内容.用户可以通过Help系统来得到帮助信息.Help(帮助)的下拉菜单(见左下图)如下:,选定对象的帮助(Help on Selec
6、tion)/:提供与加亮区或内容有关的帮助信息.介绍(Introduction):学习 SAS/Insight软件的导引.技巧(Techniques):学习如何执行一项特殊任务,比如数据输入、坐标轴和标尺调整等.,SAS/Insight的功能-帮助信息,Page12,参考(Reference):可以浏览由下拉菜单列出与SAS/Insight系统有关的详细信息.索引(Index):可快速查看SAS/Insight专题的索引.SAS系统(SAS System):查看SAS系统专题的一般索引.创建样本(Create Samples):在SASUSER库中建立样本数据集(即本使用手册所涉及的),执行过
7、程的有关信息可从LOG窗查看.,Page13,在SAS/Insight中,可对SAS数据集进行:(1)用表格方式输入数据生成数据集并浏览;(2)增加变量和观测;(3)修改测量水平;(4)移动变量的显示次序(在数据窗口移动列);(5)创建新的变量;(6)按某个变量的值对数据集进行排序;(7)选取子集;(8)存贮数据.,对数据集的操作,Page14,使用下拉菜单进入SAS/Insight后,则显示以下打开数据集的对话窗.,输入数据或打开数据集,Page15,如果所要分析的数据还没有生成SAS数据集,则在对话窗中选择新建(New)(即用鼠标单击在新建按钮上),系统将打开一个供用户输入数据的新数据窗口
8、,用户可在该窗口中方便地输入数据.,Page16,如果数据已生成SAS数据集,则从逻辑库(Library)下选中存放数据集的库名字,再从数据集(Data Set)下选中数据集名字(如CLASS),然后按打开(Open)即打开数据窗口,显示该数据集的数值表.,数据窗口的左上角给出变量个数和观测个数;每个观测有一个观测序号,序号前的符号及颜色表示该观测在作图时使用的符号和颜色;数据表上方除了给变量名外,还标明每个变量的类型是区间型(Int)或是名义型(Nom);及每个变量的作用(角色).,Page17,第二章,变量名,观测个数,变量个数,数据窗菜单,观测序号,绘图符号和颜色,变量类型,变量的作用,
9、Page18,点击数据窗口左上角的,弹出的菜单项为用户编辑数据表(如移动行或列的位置、增加变量和观测、定义变量、对观测排序等)提供许多选项.菜单项如下:,1.查找下一个(Find Next):翻卷数据窗口到下一个被选中的观测.若没有被选中的观测,则翻卷到当前的下一个观测.2.移至第一个(Move to First):将选中的观测或变量分别移至数据窗口的第一行或第一列.3.移至最后(Move to Last):将选中的观测或变量分别移至数据窗口的最后一行或最后一列.,窗口菜单浏览数据,Page19,当数据窗口中变量较多时,可以用滚动条滚动窗口内容来查看。如果某个变量比较重要,可以考虑把它放到第一
10、列的位置,这只要先单击该变量的名字选中它,然后在数据窗的菜单中选 移至第一个(Move to First)要把某列移到最后,选中它后用 移至最后(Move to Last),Page20,选中一列只要单击其变量名。如果要选中多个列,在选中一个后按住Ctrl键单击其它列的名字可以添加选中的其它变量。选中一个变量后按住Shift单击另一个变量名则表示选中这两个变量及它们之间的所有变量。选中的多个列也可以用移至第一个(Move to First)和移至最后(Move to Last)菜单项来移动。要取消所有选中,只要单击某一单元格而不是行、列标题即可。,Page21,要选中一个观测(行),只要单击其
11、观测序号(行号)。选多个观测可以用Ctrl单击或Shift单击的方法。选中的观测也可以用移至第一个(Move to First)和移至最后(Move to Last)移动到最前或最后。还可以选中某些列同时选中某些行。只要在后续的选中操作时用添加选中(Shift单击或Ctrl单击)即可。用鼠标在数据窗口数值显示部分拖出一个方框也可以选定一部分数值。选定了列或者行以后,用 编辑(Edit)=删除(Delete)菜单可以删除选定的列或行。,窗口菜单整理数据,Page22,通过使用手动工具(hand tool),用户可以把某变量(或某个行)移到不同的位置上(不一定是第一列或最后一列)。步骤如下:选择编
12、辑(Edit)窗口(Windows)工具(Tool),浏览数据手动工具,Page23,则显示一工具窗口(见右图)。用鼠标单击在工具窗口上方的“手动”工具项上。这时光标变成一只手的形状。移动这只手到变量(如AGE)名字或某个行的序号(如序号5)上。按下鼠标左键并按住它,这时有一个虚线的矩形作为变量列(或观测行)的轮廓出现。,Page24,拽这个矩形,并把它放到变量NAME(第一个变量)和SEX(第二个变量)之间的分界线上;或某二行(如第10和11行)间的分界线上。释放鼠标左键,则变量AGE变为数据窗口中的第二个变量;或者第5号观测变为第10号观测。用鼠标单击在工具窗口上方的“箭头”工具项上,这时
13、光标还原为原来形状。,Page25,排序(Sort):选定一个或几个变量(列)对观测按上升或下降的顺序进行排序.在选定了一列的情况下,把数据集按此列从小到大排序;在选定了多列的情况下,由选定的变量次序按这些变量综合排序,比如在SASUSER.CLASS窗口中先选定SEX,再按住Ctrl单击另一选定的变量HEIGHT,然后排序,这样的结果是把数据集先按女生、男生分类排序,然后在女生内部和男生内部分别按身高从小到大排序。,窗口菜单数据排序,Page26,如果没有选定任何列,则弹出一个菜单,询问按哪些变量排序,比如说DATA.BCLASS数据集,可以先点SEX,然后单击Y按钮,把性别加入了排序变量中
14、;再选中HEIGHT,单击Y按钮,把身高作为第二排序变量;再单击排序变量中的HEIGHT,单击Asc/Des按钮(这是要求对身高值要由高到低排序),按OK后数据将按性别分组,然后女生、男生内部分别按身高由高到低排列。,Page27,新建观测(New Observations):用于快速插入若干个空数据行,以便输入新观测。弹出一个对话框要求输入添加的观测数,缺省时是100个。添加的空行中字符型数据先置为空值,数值型数据先置为缺失值(用单独的小数点代表)。,新变量(New Variables):用于快速加入空列,以便输入新变量.,定义变量(Define Variables):将显示对话窗(见下页)
15、。,窗口菜单整理数据,Page28,用户可以设置变量类型、缺省时的角色、量测水平、名字和标签.在这一对话窗内,用户可以改变一个变量或几个变量的名字等属性.,Page29,填充值(Fill Value):修改该数据窗口中某个选中变量或观测的数据值,它对生成常数或以常数为增量的等差数列变量值是特别方便的.,先选定一个数值型变量,用此命令,将弹出一个对话框要求输入起始值(Value)和增量(Increment),比如起始值填1,增量填10,则此变量的在各观测中的值分别填入为1,11,21,。,Page30,抽取(Extract):从已存在的数据窗口抽取某些列(变量)或行(观测)的数据子集来生成新的数
16、据窗口.,此项功能很强,它可以把选定的部分行,部分列或者部分行和列抽取出来生成另一个新的数据窗口。比如在CLASS中先选定所有男生的观测,再用添加选择(Shift或Ctrl单击)的办法选定NAME,AGE和WEIGHT变量,然后用此命令,可以抽取出一个名为SASUSER.CLASS1的数据窗口,此数据窗口中只有姓名,年龄和体重三列及男生的观测行。,Page31,Page32,可以在主菜单中选 文件(File)保存(Save)数据(Data)把此新数据集保存为SASUSER.CLASS1。这样可以由已有数据集挑选部分列、部分行组成新数据集。,Page33,在数据选项窗口:用户可以选择数据表用变量
17、名或变量的标签显示;还可以选择Enter(回车)的方向(如向下)和Tab的方向(如为向右)。,数据选项(Data Options):设置控制数据窗口外观和操纵的选项.,Page34,在数据窗口中如果需要修改某一个值或几个值,只要直接用鼠标点到其单元格修改,然后按回车键就实现了修改。在单元格之间移动可以用鼠标单击、制表键(Tab)、回车、上下光标键等方法。,Page35,在SAS数据集中,变量分为字符型和数值型.在Insight中,为了区分变量在分析中的不同作用,变量又按其测量水平分为区间型(interval)和名义型或列名型(nominal).对于字符变量系统自动地设置为名义型;而对数值变量系
18、统自动地设置为区间型.如果某个数值变量在分析中将作为分类变量,进行分析之前应先设置该变量为名义型(Nominal).,整理数据设置测量水平,Page36,在SAS/Insight中,变量按其测量水平分为:区间型的(Interval)名义型的(Nominal),数值型 字符型,区间型名义型,以连续变化尺度测量具有可进行分析的数值变量,有数值或字符值用于作分类变量,SAS变量,Page37,设置变量的测量水平有两种方法:(1)在数据窗菜单中用定义变量菜单项在对话框里规定所选中变量的测量水平;(2)在数据窗口所选中变量名字的上方显示该变量默认的测量水平。如果需要修改默认的测量水平,在该处点击鼠标右键
19、,从显示的两种测量水平选中所需要的区间型(interval)或名义型(nominal).,Page38,如果用户想对已打开的数据窗口再创建一些新变量,有以下几种方法:(1)由数据窗菜单的菜单项新变量(New Variables)来插入新变量;(2)通过 编辑(Edit)变量(Variables)由生成新变量的计算公式来创建新变量;(3)在统计分析过程中,如果用户想把分析计算的统计量添加到数据集中,分析计算后通过主菜单项变量(Vars)选择统计量作为数据集的新变量.,整理数据创建新变量,Page39,有时用户想寻找某个变量具有共同特性的观测。例如在CLASS数据集中,为了寻找所有男生。步骤以下(
20、使用CLASS数据集,假定NAME变量放在第一列):选择编辑(Edit)观测(Observations)查找(Find)则显示查找观测(Find Observations)对话窗(见下图)。,整理数据查找观测,Page40,选择变量SEX(记录性别)。用鼠标左键点击查找观测对话窗左边的CLASS集变量列表中的变量SEX,表示选中它。在上图中,对话窗右边的值(Value)列表中列出了变量SEX的所有取值;并用上图对话窗中间检查(Test)的等号(=)来选择SEX等于右边Value表中第二个值(即“M”)的观测。选择SEX的值(Value)为“M”。如果选多个值,可以通过Shift+击或CTRL+
21、击来选择这些值。,Page41,用鼠标击在应用(Apply)按钮上来寻找符合条件的中学生所对应的观测。此时选择观测时并没有关闭查找观测对话窗。当选择符合条件的观测后,若点击在确定(OK)按钮上,则关闭查找观测对话窗。至此,SEX=M的所有观测被加亮。从数据窗菜单上选择查找下一个(Find Next)数据窗口将往下滚动,使得具有SEX=M 的观测移到数据窗口的顶部。,Page42,从数据窗菜单选择移至第一个(Move to First)。允许用户把选择的观测集中在一起查看,即所有选择的观测都移到数据窗口的开始位置。从数据窗菜单选择抽取,可以抽取出一个名为CLASS1的数据窗口,此数据窗口中只有包
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计分析 软件 基础教程 Insight 数据 探索 功能

链接地址:https://www.31ppt.com/p-6599219.html