列联表和对应分析.ppt
《列联表和对应分析.ppt》由会员分享,可在线阅读,更多相关《列联表和对应分析.ppt(34页珍藏版)》请在三一办公上搜索。
1、中央财经大学统计学院,第12章 列联表和对应分析,列联表中两个变量的独立性检验对应分析,中央财经大学统计学院 2,学习目标,列联表中两个变量独立性检验的原理和软件结果解释 对应分析的基本原理和软件结果分析,中央财经大学统计学院 3,3.1.2 列联表(Contingency table),如果对数据同时根据两个变量分组,汇总得到的结果称为列联表。列联表反映的是两个变量的联合分布,可以用来分析两个变量之间的关系。也称为交叉分组表(Cross tabulation)。列联表一般根据两个定性变量进行编制,如果是定量变量则需要先对单个变量进行分组。列联表中的数字为交叉单元格中的频数或频率。以列联表为基
2、础可以对两个变量之间的关系进行多种统计检验。,中央财经大学统计学院 4,列联表举例,市场营销专业的男生有10人。,中央财经大学统计学院 5,【例12.1】美国的General Social Survey,中央财经大学统计学院 6,二维列联表中的两个变量是否相互独立:c2检验,H0:婚姻状况和幸福状况这两个变量相互独立;H1:婚姻状况和幸福状况不相互独立。与单个变量的c2检验类似,中央财经大学统计学院 7,基本原理,行变量和列变量相互独立时,每个单元格频数的期望值 为如果期望频数和观测频数相差不大,则零假设可能是正确的;如果二者差别很大,则零假设可能不成立。,中央财经大学统计学院 8,检验统计量
3、,在零假设成立时,该统计量近似服从自由度为(r-1)(s-1)的c2分布。当该统计量的值很大(或p值很小)时,就可以拒绝零假设,认为这两个变量不相互独立。,中央财经大学统计学院 9,SPSS操作,“分析”“描述统计”“交叉表”,把“婚姻状况”设为行变量,把“幸福状况”设为列变量。接下来单击“统计量”,在弹出的对话框中选中“卡方”,单击“继续”;选择“单元格”,选中弹出对话框中的“期望值”,单击“继续”返回前一个是对话框,单击“确定”,中央财经大学统计学院 10,SPSS操作,中央财经大学统计学院 11,结果分析,中央财经大学统计学院 12,结果分析,c2统计量的值为225.274,相应的p值为
4、0.000。由于p值远远小于通常使用的显著性水平,因此检验的结论是拒绝原假设,不能认为婚姻状况和幸福状况相互独立。,中央财经大学统计学院 13,精确结果,当每个单元格的期望频数都大于5时检验统计量近似服从c2分布。在不满足这一条件时,需要把部分单元格合并,或者使用精确检验。在图12-1的对话框中选择“精确”,进行相应的设置后可以得出精确的检验结果。这时所涉及的不是c2分布,而是超几何分布。由于样本很大时超几何分布计算比较慢甚至无法计算,因此在大样本时通常使用c2统计量。,中央财经大学统计学院 14,对应分析,对应分析是一种描述性、探索性的数据分析方法,通常用于列联表的分析,以便用图形的方法观察
5、行变量和列变量取值之间的对应关系。对应分析可以按照相同的刻度同时对列联表中的行变量和列变量进行降维,用较少的维度(一般选用二维或三维)来代表数据表中的行变量和列变量,从而在同一个空间中用图形方法显示行变量和列变量类别之间的关系。,中央财经大学统计学院 15,对应分析图的绘制,在表12-1的列联表中,把3个幸福状况的取值看作3维空间中的坐标,我们可以把5个婚姻状况在3维空间中表示出来。如果使用因子分析的方法对3个幸福状况进行降维(同时最大限度地保留原始信息),则我们能够在2维甚至1维空间上把5个点表示出来。把表中婚姻状况的取值看作5维空间的坐标值,使用因子分析的方法进行降维,也可以把3个幸福状况
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 列联表 对应 分析
链接地址:https://www.31ppt.com/p-5243390.html