第五讲分析的研究的课件.ppt
第五讲 分析研究资料,重点内容:统计分析、因果分析、矛盾分析难点内容:推断统计与交互分类,第五讲 分析研究资料重点内容:统计分析、因果分析、,主要内容,第一节 基本统计分析第二节 相关分析与回归分析第三节 比较分析与类型分析第四节 矛盾分析与因果分析,主要内容第一节 基本统计分析,第一节 基本统计分析,一、频数分析二、描述统计三、探索分析四、交叉表分析五、报告摘要分析,第一节 基本统计分析一、频数分析,SPSS 统计分析功能概述,有了数据,可以利用SPSS的各种分析方法进行分析,但选择何种统计分析方法,即调用哪个统计分析过程,是得到正确分析结果的关键。SPSS有数字分析和作图分析两类方法,9/24/2022,SPSS 统计分析功能概述 有了数据,可以利用SPSS的各种,SPSS 数值分析过程,SPSS 数值统计分析过程均在Analyze菜单中,包括:a、基本统计分析:Reports,Descriptive Statisticsb、均值比较与检验:Compare Meansd、方差分析:ANOVA Modelsb、相关分析:Correlatee、回归分析:Regression f、聚类与判别:Classifyg、因子分析:Data Reduction h、非参数检验:Nonparametric Tests 等等,9/24/2022,SPSS 数值分析过程 SPSS 数值统计分析过程均在Ana,基本统计分析,基本统计分析是进行其他更深入的统计分析的前提,通过基本统计分析,用户可以对分析数据的总体特征有比较准确的把握,从而选择更为深入的分析方法对分析对象进行研究。在SPSS的Analyze菜单中包括了一系列统计分析过程。其中Reports和Descriptive Statistics命令项中包括的功能是对单变量的描述统计分析。Descriptive Statistics包括的统计功能有:Frequencies:频数分析Descriptives:描述统计量分析Explore:探索分析Crosstabs:多维频数分布交叉表(列联表)Reports包括的统计功能有:OLAP Cubes:OLAP报告摘要表Case Summaries:观测量列表Report Summaries in Row:行形式输出报告Report Summaries in Columns:列形式输出报告,9/24/2022,基本统计分析基本统计分析是进行其他更深入的统计分析的前提,,一、频数分析(Frequencies),1、了解变量的取值分布情况对整体把握数据的特征是非常有利的。2、求分类(定类、定序)变量的频数和作Bar图3、求定距变量(连续变量)的分布情况和作直方图Histogram 比Descriptives 多百分位,在Statistics选项和 Format选项)4、对连续变量进行分组(recode)后再求频数,如老中青(35,60)的比例,文化程度(中学、大学及以上)的人数及比例等5、Analyze+Descriptive Statistics+Frequencies6、例子p105-106:对1991年美国社会研究情况数据(data08-01)进行统计处理。分析不同年龄(age变量)和最高受教育年限(educ变量)各水平的频数分布情况。,9/24/2022,一、频数分析(Frequencies)1、了解变量的取值分,二、描述统计分析Descriptives,1、功能:了解数据的基本统计特征和对指定的变量值进行标准化处理(标准化后的新变量的均值为0,标准差为1,目的是为了消除各变量间变量值在数量级上的差异,从而增强数据间的可比性)。2、描述统计分析过程通过平均值(Mean)、算术和(Sum)、标准差(Std Dev)、最大值(Maximum)、最小值(Minimum)、方差(Variance)、范围(Range)、平均数标准误(S.E.Mean)等统计量对变量进行描述。3、一般是求定距变量的描述统计量,从中分析差异性(max,min)4、Analyze+Descriptive Statistics+Descriptives5、例子:1985年美国联邦研究局对50个州各种犯罪情况研究的数据(data08-02)进行描述统计分析50个州总的情况不同地区region的情况(2种方法:Split File+Descriptives,第8章的Means),9/24/2022,二、描述统计分析Descriptives1、功能:了解数据,三、探索分析 Explore,1.考察数据的奇异性和分布特征奇异性:数据的过大或过小(找出、分析原因、是否剔除)分布特征:数据是否来自正态分布总体考察方法:统计量和统计图形(箱图、茎叶图(频数、茎和叶)、方差齐次性检验Spread vs level图)2.一般是考察定距变量3.Analyze+Descriptive Statistics+Explore因(分析)变量(Dependent List):定距变量分组变量(Factor List):分类变量标识变量(Label Cases by):为方便查找输出观测量如id4.例子p112:考察银行数据(data08-03)中的不同性别的工资情况,9/24/2022,三、探索分析 Explore1.考察数据的奇异性和分布特,四、交叉表分析,二维或多维交叉频数表(列联表),分析事物(变量)之间的相互影响和关系Analyze+Descriptive Statistics+Crosstabs行变量(Row):需分类变量列变量(Column):需分类变量分层变量(Layer):条件(若有,需分类变量)Statistics选项:Chi-square复选项及其四种检验结果Correlations复选项:相关系数例子:银行数据(data08-03)中:如求男女的民族分布情况,可得到白种人多,男性多的结论(注意cell选项,一般选频数和百分比),如求每一工种的男女分布情况(人数)P118:1991年美国社会研究情况数据(data08-01):男女对生活的认识。,9/24/2022,四、交叉表分析二维或多维交叉频数表(列联表),分析事物(变,1.5 OLAP报告摘要表OLAP Cubes,OLAP(Online Analytical Processing)在线分析处理过程以分组变量为基础,计算各组的总计、均值和其他统计量。而输出的报告摘要则是指每个组中所包含的各种变量的统计信息。Analyze+Reports+OLAP CubesSummary Variables:要进行统计汇总的数值型变量Grouping Variables:分组变量(分类变量),注意:此分组变量在实际的运算过程中并不发挥分组的功能,而是确定进入统计的观测量的范围。如选择数学成绩作为摘要分析变量,而性别作为分组变量,要计算数学平均成绩,则结果中显示的并不是男生的数学平均成绩和女生的数学平均成绩,而是所有男女生观测量的数学成绩的总平均值。即所有性别有值(非Missing Value)的Case,才参与分析计算Statistics选项:Sum和、Number of Cases观测量数目、Mean均值、Median中位数、Maximum最大等等例子p122:1991年美国社会研究情况数据(data08-01):对不同种族race的孩子childs和教育educ情况进行报告摘要分析。,9/24/2022,1.5 OLAP报告摘要表OLAP CubesOLAP(On,补充:Reports的其他分析过程,Reports的其他分析过程有:Case Summaries:观测值摘要分析Report Summaries in Row:行形式输出报告Report Summaries in Columns:列形式输出报告,9/24/2022,补充:Reports的其他分析过程Reports的其他分析,Case Summaries:观测量列表,察看或打印所需要的变量值Analyze+Reports+Case SummariesVariables:要显示的变量名Grouping Variables:分组变量(分类变量)结果显示:多行或单行,9/24/2022,Case Summaries:观测量列表察看或打印所需要的变,行形式输出报告,Summary 按行,如:sum、mean、max、min、count、std dev、variance、percentage(above,below,inside)等菜单:Analyze+Reports+Report Summaries in RowsData Column:报告变量Break Column:分组变量及其Summary(多个交叉)Report:可对全部数据进行描述统计(Grand Total)Display Cases:是否显示每一个观测量,9/24/2022,行形式输出报告Summary 按行,如:sum、mean、m,列形式输出报告,Summary 按列,如:sum、mean、max、min、count、std dev、variance、percentage(above,below,inside)等菜单:Analyze+Reports+Report Summaries in ColumnsData Column:报告变量一一对应的SummaryInsert Total:汇总列,可汇总两列或多列的信息Break Column:分组变量(多个交叉)及SubtotalReport:可对全部数据进行描述统计(Grand Total),9/24/2022,列形式输出报告Summary 按列,如:sum、mean、,第二节 相关与回归分析,一、相关分析的概念和过程二、两个变量间的相关分析三、偏相关分析四、距离分析五、回归分析的概念和模型六、回归分析的过程,9/24/2022,第二节 相关与回归分析一、相关分析的概念和过程9/24/2,一、相关分析的概念与过程,研究变量间密切程度的一种常用统计方法1、线性相关分析:研究两个变量间线性关系的程度。用相关系数r来描述。2、偏相关分析:它描述的是当控制了一个或几个另外的变量的影响条件下两个变量间的相关性,如控制年龄和工作经验的影响,估计工资收入与受教育水平之间的相关关系3、相似性测度:两个或若干个变量、两个或两组观测量之间的关系有时也可以用相似性或不相似性来描述。相似性测度用大值表示很相似,而不相似性用距离或不相似性来描述,大值表示相差甚远,一、相关分析的概念与过程研究变量间密切程度的一种常用统计方法,线性相关分析,研究两个变量间线性关系的程度。相关系数是描述这种线性关系程度和方向的统计量,用r表示。如果变量Y与X间是函数关系,则r=1或r=-1;如果变量Y与X间是统计关系,则-10,如果x,y变化的方向相反,如吸烟与肺功能的关系,则称为负相关,r0.95 存在显著性相关;|r|0.8 高度相关;0.5|r|0.8 中度相关;0.3|r|0.5 低度相关;|r|0.3 关系极弱,认为不相关,线性相关分析研究两个变量间线性关系的程度。相关系数是描述这种,线性相关分析(续),相关系数的计算有三种:Pearson、Spearman和KendallPearson相关系数:对定距变量的数据进行计算,公式P207Spearman和Kendall相关系数:对分类变量的数据或变量值的分布明显非正态或分布不明时,计算时先对离散数据进行排序或对定距变量值排(求)秩。公式P208,线性相关分析(续)相关系数的计算有三种:Pearson、Sp,相关分析的SPSS过程,在Analyze+Correlate下的三个子菜单:1、Bivariate-相关分析,计算指定的两个变量间的相关关系,可选择Pearson相关、Spearman和Kendall 相关;同时对相关系数进行检验,检验的零假设为:相关系数为0(不相关)。给出相关系数为0的概率2、Partial-偏相关分析,计算两个变量间在控制了其他变量的影响下的相关关系,对相关系数也进行检验,检验的零假设为:相关系数为03、Distance-相似性测度,对变量或观测量进行相似性或不相似性测度,9/24/2022,相关分析的SPSS过程在Analyze+Correlate下,二、两个变量间的相关分析,两两变量间的相关:包括两个连续变量间的相关(Pearson相关)和两个等级(分类)变量间的秩相关(Spearman和Kendall 相关)菜单:Analyze+Correlate+Bivariatea、连续变量间的相关:Pearson。P211 Data07-03 银行职工的起始工资salbegin和现工资salary与雇员本人各方面条件的关系(年龄age、工作时间jobtime、以前工作经验prevexp):比较有用的结果:Pearson相关系数r和其相应的显著性概率Sig(Pearson相关系数均很小),9/24/2022,二、两个变量间的相关分析两两变量间的相关:包括两个连续变量,二、两个变量的相关分析,b、等级(分类)变量间的秩相关:Spearman和Kendall。P212 Data07-03 银行职工的起始工资salbegin和现工资salary与雇员的职务等级jobcat、受教育程度educ关系(比较有用的结果:Kendall秩相关系数r和其相应的显著性概率Sig(Kendall秩相关系数均.5,认为中度相关)P213 Data10-02 某次全国武术女子前10名运动员长拳和长兵器两项得分数据,要求分析这两项得分是否存在线性相关(比较有用的结果:秩相关系数r和其相应的显著性概率Sig(秩相关系数均.5,认为中度相关),9/24/2022,二、两个变量的相关分析b、等级(分类)变量间的秩相关:Sp,三、偏相关分析的概念,线性相关分析计算两个变量间的相关关系,分析两个变量间线性关系的程度。往往因为第三个变量的作用,使相关系数不能真正反映两个变量间的线性程度。如身高、体重与肺活量之间的关系。如果使用Pearson相关计算其相关系数,可以得出肺活量与身高和体重均存在较强的线性关系。但实际上,如果对体重相同的人,分析身高和肺活量,是否身高越高,肺活量就越大呢?不是的。原因是身高与体重有线性关系,体重与肺活量存在线性关系,因此得出身高和肺活量之间存在着较强的线性关系的错误结论。偏相关分析的任务就是在研究两个变量之间的线性相关关系时控制可能对其产生影响的变量。分析身高与肺活量之间的相关性,就要控制体重在相关分析中的影响。实际生活中有许多这样的关系,如可以控制年龄和工作经验两个变量的影响,估计工资收入与受教育程度之间的相关关系。可以在控制了销售能力与各种其他经济指标的情况下,研究销售量与广告费用之间的关系等。,9/24/2022,三、偏相关分析的概念 线性相关分析计算两个变量间的相关关系,偏相关分析的SPSS过程和实例,菜单:Analyze+Correlate+PartialVariables:分析变量Controlling for:控制变量实例P220Data10-03 使用四川绵阳地区3年生中山柏的数据,分析月生长量hgrow与月平均气温temp、月降雨量rain、月平均日照时数hsun、月平均湿度humi这四个气候因素的哪个因素有关。将月生长量hgrow作为分析变量,然后分四次,分别将其中的一个因素作为分析变量,而其他三个作为控制变量用Pearson相关系数结果P223:中山柏生长量与气温temp关系最为密切,相关系数0.9774,显著性概率p=0.000;其次是湿度humi,相关系数0.7310,显著性概率p=0.025;日照时数hsun,相关系数0.6318,显著性概率p=0.068;与降雨量没有线性关系,降雨量过大,还会影响其生长。,9/24/2022,偏相关分析的SPSS过程和实例菜单:Analyze+Cor,四、距离分析,是对观测量之间或变量之间相似或不相似程度的一种测度,是一种广义的距离。有关的统计量。不相似性测度:a、对等间隔(定距)数据的不相似性(距离)测度可以使用的统计量有Euclid欧氏距离、欧氏距离平方等。b、对计数数据使用卡方。c、对二值(只有两种取值)数据,使用欧氏距离、欧氏距离平方、尺寸差异、模式差异、方差等相似性测度:a、等间隔数据使用统计量Pearson相关或余弦。b、测度二元数据的相似性使用的统计量有20余种。距离分析分为观测量之间距离分析和变量之间距离分析。,9/24/2022,四、距离分析是对观测量之间或变量之间相似或不相似程度的一种,距离分析实例,实例P227Data10-03 仍使用四川绵阳地区3年生中山柏的数据。菜单:Analyze+Correlate+Distance观测量间的距离分析(不相似性测度,使用欧氏距离),分析月生长量hgrowVariables分析变量:月生长量hgrowLabel Case by:月份MonthCompute Distances:Between CaseMeasure:不相似性测度结果P228:观测量间的欧氏距离(1月与8月的生长量最不相似,其欧氏距离值为19.290,而1月与2月生长量不相似性最小,值为0.490)变量间的不相似性Variables分析变量:temp、rain、hsun、humiCompute Distances:Between VariablesMeasure:不相似性测度,欧氏距离,分析变量测度的单位不同,所以要进行标准化,Transform Values:By Variable,Z Score结果P229:变量间的欧氏距离矩阵(不相似矩阵)还可以重新进行相似性分析,得Pearson相关系数矩阵,然后跟欧氏距离矩阵相比较。,9/24/2022,距离分析实例实例P227Data10-03 仍使用四川绵阳,五、回归分析的概念与模型,寻求有关联(相关)的变量之间的关系主要内容:从一组样本数据出发,确定这些变量间的定量关系式对这些关系式的可信度进行各种统计检验从影响某一变量的诸多变量中,判断哪些变量的影响显著,哪些不显著利用求得的关系式进行预测和控制,五、回归分析的概念与模型寻求有关联(相关)的变量之间的关系,回归分析的模型,按是否线性分:线性回归模型和非线性回归模型按自变量个数分:简单的一元回归,多元回归基本的步骤:利用SPSS得到模型关系式,是否是我们所要的,要看回归方程的显著性检验(F检验)和回归系数b的显著性检验(T检验),还要看拟合程度R2(相关系数的平方,一元回归用R Square,多元回归用Adjusted R Square),回归分析的模型按是否线性分:线性回归模型和非线性回归模型,六、回归分析的过程,在回归过程中包括:Liner:线性回归Curve Estimation:曲线估计Binary Logistic:二分变量逻辑回归Multinomial Logistic:多分变量逻辑回归Ordinal 序回归Probit:概率单位回归Nonlinear:非线性回归Weight Estimation:加权估计2-Stage Least squares:二段最小平方法Optimal Scaling 最优编码回归我们只讲前面3个简单的(一般教科书的讲法),六、回归分析的过程在回归过程中包括:,1.线性回归(Liner),一元线性回归方程:y=a+bxa称为截距b为回归直线的斜率用R2判定系数判定一个线性回归直线的拟合程度:用来说明用自变量解释因变量变异的程度(所占比例)多元线性回归方程:y=b0+b1x1+b2x2+bnxnb0为常数项b1、b2、bn称为y对应于x1、x2、xn的偏回归系数用Adjusted R2调整判定系数判定一个多元线性回归方程的拟合程度:用来说明用自变量解释因变量变异的程度(所占比例)一元线性回归模型的确定:一般先做散点图(Graphs-Scatter-Simple),以便进行简单地观测(如:Salary与Salbegin的关系)若散点图的趋势大概呈线性关系,可以建立线性方程,若不呈线性分布,可建立其它方程模型,并比较R2(-1)来确定一种最佳方程式(曲线估计)多元线性回归一般采用逐步回归方法-Stepwise,1.线性回归(Liner)一元线性回归方程:y=a+bx,逐步回归方法的基本思想,对全部的自变量x1,x2,.,xp,按它们对Y贡献的大小进行比较,并通过F检验法,选择偏回归平方和显著的变量进入回归方程,每一步只引入一个变量,同时建立一个偏回归方程。当一个变量被引入后,对原已引入回归方程的变量,逐个检验他们的偏回归平方和。如果由于引入新的变量而使得已进入方程的变量变为不显著时,则及时从偏回归方程中剔除。在引入了两个自变量以后,便开始考虑是否有需要剔除的变量。只有当回归方程中的所有自变量对Y都有显著影响而不需要剔除时,在考虑从未选入方程的自变量中,挑选对Y有显著影响的新的变量进入方程。不论引入还是剔除一个变量都称为一步。不断重复这一过程,直至无法剔除已引入的变量,也无法再引入新的自变量时,逐步回归过程结束。,逐步回归方法的基本思想对全部的自变量x1,x2,.,xp,2.线性回归分析实例,实例:P240Data07-03 建立一个以初始工资Salbegin、工作经验prevexp、工作时间jobtime、工作种类jobcat、受教育年限edcu等为自变量,当前工资Salary为因变量的回归模型。先做数据散点图,观测因变量Salary与自变量Salbegin之间关系是否有线性特点Graphs-Scatter-SimpleX Axis:SalbeginY Axis:Salary若散点图的趋势大概呈线性关系,可以建立线性回归模型Analyze-Regression-LinearDependent:SalaryIndependents:Salbegin,prevexp,jobtime,jobcat,edcu等变量Method:Stepwise比较有用的结果:拟合程度Adjusted R2:越接近1拟合程度越好回归方程的显著性检验Sig回归系数表Coefficients的Model最后一个中的回归系数B和显著性检验Sig得模型:Salary=-15038.6+1.37Salbegin+5859.59jobcat-19.55prevexp+154.698jobtime+539.64edcu,2.线性回归分析实例实例:P240Data07-03 建立,3.曲线估计(Curve Estimation),对于一元回归,若散点图的趋势不呈线性分布,可以利用曲线估计方便地进行线性拟合(liner)、二次拟合(Quadratic)、三次拟合(Cubic)等。采用哪种拟合方式主要取决于各种拟合模型对数据的充分描述(看修正Adjusted R2-1),3.曲线估计(Curve Estimation)对于一元,曲线估计(Curve Estimation)分析实例,实例P247 Data11-01:有关汽车数据,看mpg(每加仑汽油行驶里程)与weight(车重)的关系先做散点图(Graphs-Scatter-Simple):weight(X)、mpg(Y),看每加仑汽油行驶里程数mpg(Y)随着汽车自重weight(X)的增加而减少的关系,也发现是曲线关系建立若干曲线模型(可试着选用所有模型Models)Analyze-Regression-Curve EstimationDependent:mpgIndependent:weightModels:全选(除了最后一个逻辑回归)选Plot models:输出模型图形比较有用的结果:各种模型的Adjusted R2,并比较哪个大,结果是指数模型Compound的Adjusted R2=0.70678最好(拟合情况可见图形窗口),结果方程为:mpg=60.15*0.999664weight说明:Growth和Exponential的结果也相同,也一样。,曲线估计(Curve Estimation)分析实例实例P,3.二项逻辑回归(Binary Logistic),在现实中,经常需要判断一些事情是否将要发生,候选人是否会当选?为什么一些人易患冠心病?为什么一些人的生意会获得成功?此问题的特点是因变量只有两个值,不发生(0)和发生(1)。这就要求建立的模型必须因变量的取值范围在01之间。Logistic回归模型Logistic模型:在逻辑回归中,可以直接预测观测量相对于某一事件的发生概率。包含一个自变量的回归模型和多个自变量的回归模型公式:其中:z=B0+B1X1+BpXp(P为自变量个数)。某一事件不发生的概率为Prob(no event)1-Prob(event)。因此最主要的是求B0,B1,Bp(常数和系数)数据要求:因变量应具有二分特点。自变量可以是分类变量和定距变量。如果自变量是分类变量应为二分变量或被重新编码为指示变量。指示变量有两种编码方式。回归系数:几率和概率的区别。几率=发生的概率/不发生的概率。如从52张桥牌中抽出一张A的几率为(4/52)/(48/52)=1/12,而其概率值为4/52=1/13 根据回归系数表,可以写出回归模型公式中的z。然后根据回归模型公式Prob(event)进行预测。,3.二项逻辑回归(Binary Logistic)在现实中,4.二项逻辑回归(Binary Logistic)实例,实例P255 Data11-02:乳腺癌患者的数据进行分析,变量为:年龄age,患病时间time,肿瘤扩散等级pathscat(3种),肿瘤大小pathsize,肿瘤史histgrad(3种)和癌变部位的淋巴结是否含有癌细胞ln_yesno,建立一个模型,对癌变部位的淋巴结是否含有癌细胞ln_yesno的情况进行预测。Analyze-Regression-Binary LogisticDependent:ln_yesnoCovariates:age,time,pathscat,pathsize,histgrad比较有用的结果:在Variables in Equation表中的各变量的系数(B),可以写出z=-0.86-0.331pathscat+0.415pathsize 0.023age+0.311histgrad。根据回归模型公式Prob(event)=1/(1+e-z),就可以计算一名年龄为60岁、pathsize为1、histgrad为1、pathscat为1的患者,其淋巴结中发现癌细胞的概率为1/(1+e-(-1.845)=0.136(Prob(event)0.5 预测事件将会发生),4.二项逻辑回归(Binary Logistic)实例实例,第三节 比较分析与类型分析,一、比较分析的概念二、比较分析的原则与方法三、类型分析的概念四、类型分析的方法,第三节 比较分析与类型分析一、比较分析的概念,一、比较分析法的概念,比较分析法就是通过对各种事物或社会现象的对比,确定事物的共同点与不同点,并进一步揭示事物的本质区别的一般分析研究方法。比较分析是人类认识自然、社会及人类自身的基本方法。例:结绳记事,一、比较分析法的概念比较分析法就是通过对各种事物或社会现象的,二、比较分析的原则和方法,(一)比较分析的一般原则1、相比的事物必须具有可比性2、历史比较与现实比较相结合3、求同与求异相结合4、全面比较与重点比较(现象比较与本质比较)相结合,二、比较分析的原则和方法(一)比较分析的一般原则,二、比较分析的原则和方法,(二)比较分析的方法1.异同比较法2.历史比较法3.横向比较法4.主题比较法,二、比较分析的原则和方法(二)比较分析的方法,民俗社会与法理社会的基本差异,民俗社会与法理社会的基本差异社会特征社会类型民俗社会法理社会,传统家庭与现代家庭的特征,传统家庭与现代家庭的特征传统家庭现代家庭家庭组织大家族性的组,三、类型分析法的概念,类型分析法就是对客观事物进行分类或者建立类型的方法。类型比较的主要作用就是将千变万化的客观事物或社会现象进行分类,但分类并不是最终目的,最终的目的是为了进一步研究,起到由点及面、由个别到一般、由局部到整体的作用。同时还可抽象出事物的本质特征。,三、类型分析法的概念类型分析法就是对客观事物进行分类或者建立,四、类型分析的方法,(二)类型比较法在社会研究中,德国社会学家马克思韦伯提出了理想类型分析方法。所谓理想类型分析方法就是从具体独特的社会现象中抽取一些主要性质,舍弃其他性质而建立的类型或者典型的社会比较分析方法。例如马克思韦伯的权力的三种类型。文化比较、制度比较或社会结构比较都属于类型比较。,四、类型分析的方法(二)类型比较法,毛泽东:中国社会的各阶级:地主阶级、买办阶级、中产阶级、小资产阶级、半无产阶级、无产阶级、游民无产者敌人、朋友、依靠谁、团结谁、反对谁,毛泽东:,比较分析法的评价,比较分析的优点在于建立类型、区分异同,为社会研究的深入进行提供基础比较分析的缺点或局限在于比较只能就部分进行,比较无法说明事物的原因及规律,比较特别是社会现象之间的比较在很大程度上存在不可比问题,即使可比,也未必有用。但是无论如何,比较分析也是社会研究的重要方法。,比较分析法的评价比较分析的优点在于建立类型、区分异同,为社会,第四节 因果分析与矛盾分析,一、因果分析的概念 二、因果分析的方法三、因果分析的评价 四、矛盾分析的概念五、矛盾分析的方法,第四节 因果分析与矛盾分析一、因果分析的概念 二、因果分,一、因果分析的概念,因果分析是指在社会研究资料过程中对事物之间或者事物内部的各个要素之间的具有发生时间前后顺序的共变关系的分析方法。1.普通逻辑层次上的因果分析方法2.辨证逻辑层次上的因果分析方法,一、因果分析的概念因果分析是指在社会研究资料过程中对事物之间,二、因果分析的方法,(一)求同法(二)求异法(三)求同求异法(四)共变法(五)剩余法,二、因果分析的方法,(一)求同法,结论:X1是Y的原因。,(一)求同法,(二)求异法,结论:X1是Y的原因。,(二)求异法,(三)求同求异法,结论:X1是Y的原因。,(三)求同求异法,(四)共变法,在其他先行情况相同、只有一种情况不同的条件下,当这种情况发生变化时,被研究对象也发生相应变化,则可以认为,该因素是被研究事物发生变化的原因。,(四)共变法,共变法的模型,A1,B,C,D,a1A2,B,C,D,a2A3,B,C,D,a3所以,A是a的原因。,共变法的模型,在研究某种复杂的社会现象时,如果我们已知某些原因与某些结果相对应,那么,被研究对象的剩余部分必然与其他剩余的影响因素相对应。,(五)剩余法,(五)剩余法,剩余法举例,例如:对一个国家或地区人口增长的影响因素主要有:生育政策(X1);医疗水平(X2);出国政策(X3);移民政策(X4);现在已知:X2是导致死亡人数改变的原因;X3是导致迁出人数改变的原因;X4是导致迁入人数改变的原因;那么:X1就是导致出生人数改变的原因。,剩余法举例例如:对一个国家或地区人口增长的影响因素主要有:生,剩余法的模型,被研究的复合现象a,b,c,d的复合原因是A,B,C,D已知 B是b的原因;已知 C是c的原因;已知 D是d的原因;则:A是a的原因。,剩余法的模型被研究的复合现象a,b,c,d的复合原因是A,B,1、因果关系是有条件的和相对的。2、因果关系是特指的、对应的。3、因果关系是对称的、相当的。4、因果关系是多样的、特殊的。(1)一因多果、同因异果(2)一果多因、异因同果(3)多因多果、复合因果,辨证逻辑上的因果关系分析,辨证逻辑上的因果关系分析,三、因果分析法的评价,求同法与求异法实际上就是比较分析法求同求异法则是相关分析的思想基础共变法是多变量分析或因素分析的思想基础,剩余法在实践中又很难得到应用。因此,因果分析只能进行一般初步分析,分析因果关系还必须结合辨证分析方法进行。辨证分析就是从各种角度、各种对立的方面进行思维的抽象与综合。,三、因果分析法的评价求同法与求异法实际上就是比较分析法,四、矛盾分析的概念,矛盾分析法是对立统一规律的具体运用,矛盾分析法是帮助人们揭示事物发展的源泉、动力及内容。事物发展的源泉和动力是事物内部的矛盾性。对立和同一是事物矛盾的固有特性。通过事物对立和同一这两种属性之间的相互吸引、相互斗争及相互转化,推动事物向前发展。,四、矛盾分析的概念矛盾分析法是对立统一规律的具体运用,矛盾,四、矛盾分析的方法,(一)内因外因分析法内因是变化的根据,外因是变化的条件,外因要通过内因起作用。在矛盾分析的过程中,必须注意:1、善于分析事物发展的内部原因2、善于分析事物发展的外部原因。3、善于分析事物内部原因和外部原因的相互转化。,四、矛盾分析的方法(一)内因外因分析法,例子,佘氏杀妻案原因分析:1、迫于死者家属压力;2、缺乏技术条件;3、有罪推导司法模式的影响,例子佘氏杀妻案,例子,佘氏杀妻案原因分析:1、司法制度;2、司法人员的素质;,例子佘氏杀妻案,五.矛盾分析法,(二)矛盾性质、类别、程度甄别法承认社会矛盾的普遍性但是更需要分析其特殊性。因为矛盾的特殊性决定了解决矛盾方法措施的多样性。分析矛盾的特殊性,必须注意:1、分析社会现象性质的特殊性;2、分析社会现象发展过程的特殊性;3、分析社会现象发展阶段的特殊性;4、分析社会现象矛盾系统各种不同矛盾地位的特殊性;5、分析解决各种特殊矛盾的办法和路径的特殊性。,五.矛盾分析法(二)矛盾性质、类别、程度甄别法,第五讲分析的研究的课件,