《基本统计分析》PPT课件.ppt
《《基本统计分析》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《基本统计分析》PPT课件.ppt(56页珍藏版)》请在三一办公上搜索。
1、基本统计分析,返回,1 频数分布分析,返回,定义:频数就是一个变量在各个变量值上取值的个案数。如要了解学生某次考试的成绩情况,需要计算出学生所有分数取值,以及每个分数取值有多少个人,这就需要用到频数分析。变量的频数分析正是实现上述分析的最好手段,它可以使人们非常清楚地了解变量取值的分布情况。,利用一维频数分布表可以对数据按组进行归类整理,形成各变量的不同水平的频数分布表和图形,以便对各变量的数据特征好观测量分布状况有一个概括的认识。交叉表分析过程可以生成二维或多维频数表,还可以进行分类变量之间的独立性检验。,返回,一、一维频数分布分析过程(data05-01)Analyze descripti
2、ve statistics frequencies,选择statistics(输出统计量)对话框,返回,如果中位数与众数相差很大,说明观测量中存在异常值,Charts(图形)参数选择对话框,返回,频数分布表format(格式)对话框,返回,Data05-01 age eudc不同年龄人员与其受教育年限的统计表,返回,受教育年限的频数分布表,返回,age变量的直方图,返回,educ变量直方图,返回,二、交叉表分析analyze descriptive statistics crosstabs(data05-01),返回,前面的分析都是对单个变量的数据分布情况进行分析。但在实际分析中,还需要掌握多
3、个变量在不同取值情况下的数据分布情况,从而进一步深入分析变量之间的相互影响和关系,这种分析就称为交叉列联表分析。交叉列联表分析除了列出交叉分组下的频数分布外,还需要分析两个变量之间是否具有独立性或一定的相关性。要获得变量之间的相关性,仅仅靠频数分布的数据是不够的,还需要借助一些变量间相关程度的统计量和一些非参数检验的方法。,常用的衡量变量间相关程度的统计量是简单相关系数(参见本书有关章节),但在交叉列联表分析中,由于行列变量往往不是连续变量,不符合计算简单相关系数的前提条件。因此需要根据变量的性质,选择其他的相关系数,如Kendall等级相关系数、Eta值等。,SPSS提供了多种适用于不同相关
4、系数的相关关系,这些检验的零假设是:行和列变量之间彼此独立,不存在显著的相关关系。SPSS将自动给出检验的P值,如果P值小于显著性水平0.05,那么应拒绝零假设,认为行列变量之间彼此相关。,计算公式如下。(1)卡方统计量检验是常用的检验行列变量之间是否相关的方法。交叉列联表的卡方检验零假设是:行列变量之间独立,计算公式为,卡方统计量服从(行数1)(列数1)个自由度的卡方统计,SPSS在自动计算卡方统计量后,还会给出相应的P值。注意:使用这个统计量进行检验时,要求期望频数大于等于5。若不满足该条件需要使用精确检验法。,(2)Contingency coefficient:列联系数。用于名义变量之
5、间的相关系数计算。计算公式由卡方统计量修改而得,公式为 其中,N为观测量数 其数值在01之间,0表示行列变量之间没有关联,1表示行列变量之间有很强的关联。,(3)Phi and Cramers V:系数。用于名义变量之间的相关系数计算。计算公式由卡方统计量修改而得,公式为 数值界于01之间,其中K为行数和列数较小的实际数。,返回,一个行变量和一个列变量可以形成一个二维交叉表,再指定一个分组变量作为控制变量就形成三维交叉表。如果可以指定多个行、列、控制变量,就会形成一个复杂的多维交叉表。交叉表的数据可以是数值型或字符型变量,短字符串变量可以直接作为分类变量。,选择statistics(统计量)对
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基本统计分析 基本 统计分析 PPT 课件
链接地址:https://www.31ppt.com/p-5487149.html