《分类数据分析》PPT课件.ppt
《《分类数据分析》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《分类数据分析》PPT课件.ppt(42页珍藏版)》请在三一办公上搜索。
1、Analysis of nominal data,分类数据分析,分类数据分析简介,分类数据也称名义数据,是社会科学研究的组成部分,其数据信息仅代表数据类别。例如种族,1=白种人,2=黄种人,3=黑人。根据每个类别的数量,可以分析它们之间的关系。分类数据的分析要求研究者应首先决定如何分类。,分类数据分析的应用范围,政治学领域:研究政治立场是否影响政治派别。社会学和心理学领域:分析不同类别的人不同的心理特征。公共政策分析领域:研究不同政策在不同地区产生的效果。文化传播领域:研究人们对媒体的看法。分类数据分析是社会科学中最重要的课题之一。一方面因为它的用途广泛,另一方面因为它解决的是基本问题,一些简
2、单概念的解释,分类:最理想的分类是这些类别相互区别并且没有遗漏。统计过程中都假设分类是有意义的。自变量和因变量:区别在于是否引起另外一个变量的变化。取样:从总体抽取的简单随机样本。符号:I、J表示表格的行数和列数,X、Y、Z表示变量。,表1:党派和立场间的关系,X:党派,Y:立场,表2:受党派和地区影响的立场,Z:地区=西部X:党派,Y:立场,Z:地区=非西部X:党派,Y:立场,表3:标准IJ表格,X:自变量,Y:因变量,相关程度的测量,相关程度的测量方法是用一个系数来表示变量间的相关程度。选择何种方法要考虑三个方面:测量方法是否对称:是否可以确定自变量和因变量。系数如何解释:取决于不同的测量
3、方法制定的标准。测量方法的敏感度:尽量使用敏感度较低的方法。,表5:完全相关的三种类型,Y,Totals,Y,Totals,a 严格完全相关,b 隐含完全相关,c 弱完全相关,干扰因素和解决办法,边际分布不均匀(如表6):调整数据 将表格标准化 选择对边际总数不敏感的测量方法行列不相等:选择可以达到最大值的测量方法。,表6:不同边际分布,相同相关程度,(a),(b),22表格的测量方法,1、百分比法2、差额比率法3、Yules Q4、Yules Y5、6、相关系数,百分比法,如果因变量在自变量的一个分类中的百分比发生了变化,那么这两个变量就是相关的;如果不发生变化,就是独立的。百分比法的性质:
4、对因变量的边际总数不敏感。需要较大的样本容量。,百分比法,0.90.4=0.5,差额比率法,Y:立场,差额比率法的性质,差额比率法的性质,差额比率的性质,差额比率的性质,差额比率的取值范围是从0到,等于1.0说明独立,小于1.0表示消极相关,大于1.0表示积极相关差额比率对边际总数不敏感。差额比率是对称的差额比率在弱完全相关时就达到了最大值。,差额比率的方差,当样本容量大于25时,我们可以计算出差额比率的方差。,我们可以计算置信区间,Yules Q,Yules Q是差额比率的一个函数,定义如下:,它的方差可以由以下公式计算:,Yules Q的性质,因为Q是差额比率的一个函数,因此基本具有和差额
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 分类数据分析 分类 数据 分析 PPT 课件

链接地址:https://www.31ppt.com/p-5470383.html