社会科学研究定量方法第三章.ppt
社会科学研究定量方法,大连海事大学刘巍,第三章统计分析,第1节 统计分析的作用和原则第2节 单变量统计描述第3节 双变量统计分析,第1节 统计分析的作用和原则,一、统计分析的作用统计分析就是帮助人们提高控制数字的能力,透过这些庞杂的数字和复杂的关系去把握其内在的规律性的一种有利的工具。,统计分析的作用,1、可对资料进行简化和描述是统计分析作用之一描述统计:以精简的数字来综合大量的事实,对研究变量自身特征作出清晰的描述。注意:在用某种精简的数字对大量资料进行概括综合时,必然要损失掉某些信息。所以,要用多种精简数字来综合和描述资料的不同特性。,统计分析的作用,2、可对变量之间的关系进行描述和深入的分析是社会研究的最重要的内容之一统计分析为深入描述和分析变量间关系,进而达到理论解释提供了十分有利的手段。运用实验的方法研究多个变量之间的因果关系存在许多困难,统计分析对社会研究的一大贡献就是通过事后解释使探讨变量间复杂的因果联系成为可能。3、可通过样本资料推断总体,二、统计分析的步骤和原则,统计分析的步骤:1、对应用统计分析的前提条件进行考察2、制定统计分析方案(1)再次确定自变量和因变量(2)定义复合变量(3)变量分组(4)提出统计计算的要求并提出适当的统计方法。3、选择统计分析方法的原则(1)社会研究的目的(2)研究资料的性质,主要包括四个方面:变量的测量层次 资料的收集方法 数据的分布形态 变量的个数4、对于统计结果的解释,第2节 单变量统计描述,一、变量的分布变量的分布为两类:1、频次分布 2、频率分布 二、统计表与统计图,单变量统计描述,三、集中趋势分析集中趋势是从一组数据中抽象出的一个代表值,以代表现象的共性和一般水平。集中趋势的作用:说明某一社会现象在一定条件下数量的一般水平;对不同空间的同类现象或同一现象在不同时间的状态进行比较;分析某些社会现象之间的依存关系。常用的测量指标:1、众数:出现频率最高的变量值。2、中位数:是将观察总数一分为二的变量值。3、平均数,单变量统计描述,四、离中趋势分析离中趋势:用以概括描述数据间差异程度的统计指标。常用的测量指标:1、异众比率:非众数的各变量值的总频数在观察总数中的比例。2、极差:等于最大观察值与最小观察值间的差。是对定序及定序以上尺度的变量离散程度的测量。3、四分互差:Q=Q3 Q1 是对定序及定序以上尺度的变量离散程度的测量。四分位数:4、方差与标准差:只适用于定距变量。5、离散系数与标准分数:离散系数是标准差与平均数之百分比。标准分数,第3节 双变量统计分析,一、列联表(交互分类表)交互分类:同时依据两个变量的值,将所研究的个案分类。目的是将两变量分组,比较两组的分布状况,以寻找变量间的关系。,双变量统计分析,二、消减误差比例相关系数有各种类型,其中大部分含有消减误差比例的意义。消减误差比例:指一种对变量间关系的测定,简称PRE。PRE值表示:用一个社会现象(x)来解释另一个社会现象(y)时,能够消除百分之几的错误,即x对y的解释力有多大。PRE=E1E2/E1,双变量统计分析,三、相关分析相关:指两个变量间存在一种连带关系,即当一个变量的值发生变化时,另一个变量的值也相应地发生变化。,双变量统计分析,按照变量的不同测量层次对各种相关系数简单介绍:1、定类变量定类变量 用于测量两个定类变量的相关系数,主要有Lambda 与Tau-y两种。(1)Lambda()系数分为:对称形式用于测量两个变量间的关系是对等的,即无自变量与因变量之分。非对称形式测量两个变量间的关系有自变量与因变量之分。(2)Tau-y系数:用于测量变量间非对称关系的。,双变量统计分析,2、定序变量定序变量 如果测量两个定序尺度变量间的关系,可用Gamma系数、dyx系数和斯皮尔曼等级相关系数。(1)Gamma(G)系数:分析两个变量间的对等关系,即无自变量与因变量之分。(2)dyx系数:等级相关系数,两个变量间的关系是非对称的。(3)斯皮尔曼(Spearman)等级相关系数():考虑单个个案在两个变量上的等级差异,测量两变量间对等相关关系。,双变量统计分析,3、定距变量定距变量 测量两个定距变量相关系数的最常用指标是皮尔森(Pearson)相关系数()。(要求N50而且两个变量的分布应近似于正态分布。)4、定类变量定距变量 两个变量中,自变量为定类变量,因变量为定距变量时,采用相关比率来测量两者间相关程度。(又称eta平方系数 E)5、定类变量定序变量 对一个定类变量例如性别,与一个定序变量例如收入水平关系的分析:第一,用theta系数(),专门测量定类变量与定序变量间关系有无和强度,非对称关系。第二,采用系数和Tau-y系数,即将定序变量作为定类变量处理。,双变量统计分析,6、定序变量定距变量 处理一个定序变量例如教育水平,与一个定距变量如年均收入之间的关系,采用二种办法:第一,将定序变量看作定类变量,采用相关比例测量法。第二,将定序变量看作定距变量,采用相关系数。,双变量统计分析,小结:在分析两个变量关系时,选择哪种相关系数,主要考虑两个方面:1、变量的测量层次;2、变量关系的类别,即是对等的还是非对称的。,双变量统计分析,四、一元方差分析一元方差分析是关于一个定类变量和一个定距变量的分析,二元方差分析是关于二个定类变量和一个定距变量的分析,-依此类推,n元方差分析是关于n个定类变量和一个定距变量的分析,二元以上的方差分析都叫多元方差分析。,双变量统计分析,五、一元回归分析对相关的两个变量间关系的具体形态的一种深入分析。1、一元回归模型:对于已知相关的两个变量x与y,假设它们之间是一种线性关系。2、散点图与回归直线:直观地看出x与y关系形态。3、回归系数与相关系数:都是描述两个定距变量间的线性关系的指标。4、回归分析的作用:回归分析模型是一种因果关系模型,作用大于相关分析。增加了预测功能。,第三章结束,