第三讲.双变量分析ppt课件.ppt
《第三讲.双变量分析ppt课件.ppt》由会员分享,可在线阅读,更多相关《第三讲.双变量分析ppt课件.ppt(97页珍藏版)》请在三一办公上搜索。
1、第三讲 双变量的统计分析,单变量的分析和统计描述,是我们了解和认识社会现象的基础。但社会生活中的现象并不是孤立存在的,现象之间往往存在或多或少的关系,或者说,社会现象之间往往是相互联系、相互影响、相互依存的。,“学好数理化,走遍天下都不怕”“学好数理化,不如有个好爸爸”,进一步了解社会现象发生和变化的原因,揭示社会现象的发展规律,探索和发现现象之间的关系,才是大多数社会研究的主要目的,而这则需要对两个变量或多个变量之间的关系进行分析。,变量之间的关系,两个变量之间的关系多个变量之间的关系在多数情况下,多个变量之间的关系又可以分解为若干个两个变量之间的关系,也就是说多个变量之间的关系可以通过若干
2、个两个变量间的关系来描述。,知识点,相关关系和因果关系主要的双变量的测量方法(1)交互分析列联表分析(2)不同层次变量的相关测量法,一、相关关系(correlation),两变量间的相关关系指的是一个变量的值与另一个变量有连带关系。也就是,当一个变量发生变化时(或取值不同时),另一个变量也随之发生变化。(P68)如:文化程度 收入期望女性的文化程度 生育期望,1、相关的性质,(1)相关关系的强度相关程度,指的是相关关系的强弱或大小。相关关系的强弱或大小可以用统计法进行测量。变量间相关关系的统计结果称为相关系数。相关关系的程度介于0,1之间,0代表无相关,1 代表全相关,数值越大,表示相关的程度
3、愈强。,两点说明:,1.在对社会现象和社会行为的调查中,一般来说各种相关系数的值不可能达到1或一1)。也就是说,在社会研究中不可能存在两个完全相关的事物或现象2. 相关系数只是用来表示变量间相关程度的指标,而不是相关数值的等单位度量。如不能说相关系数0.6是相关系数0.3的2倍,只能说相关系数0.6的两个变量的关系比相关系数0.3的两个变量的关系更强。,X和Y分别代表两个变量,各有二个取值(1,2),表中的a、b、c、d分别表示不同情况下个案的数目,如果a=d=0或b=c=0,则表示X和Y全相关; 如果ad=bc,即,则表示X和Y无关; 如果adbc或adbc,则表示X和Y有相关关系。,例1:
4、a=d=0或b=c=0,两个变量全相关,例2:ad=bc,对角线相等,则表示无相关,例3:如果adbc或adbc,则表示X和Y有相关关系。,(2)相关关系的方向(+、-),正相关关系和负相关关系正相关关系:一个变量的取值增加时,另一个变量的取值也增加,反之亦然;人们的文化程度越高,他们的收入水平也越高;文化程度较低的人,他们的收入水平也普遍较低。反之,那些收入水平较低的人,他们的文化程度一般来说也较低。,负相关关系:一个变量的取值增加时,另一个变量的取值减少;而一个变量的值减少时,另一个变量的值增加。在调查中发现,文化程度越高的被调查者,在回答问卷时,花费的时间越少,而文化程度较低的被调查者,
5、填答问卷时花费的时间较长。在此,我们可以说文化程度和问卷填答时间之间存在着负相关关系。 注意:方向的分析只适用于定序以上层次的变量,(3)相关关系的对称性与非对称性,相关的两个变量,不一定有因果关系,可能是共同变化。不对称关系:自变量X影响因变量Y,但是因变量Y不会影响X-因果关系,如施肥量和小麦产量之间的关系对称关系:不能确定或区分两个变量的方向。如交往的多少与他们的互爱程度,因果关系,大多数的社会研究,都涉及因果关系的概念,社会研究的最终目的,往往在于希望获得某些社会现象间因果关系的知识。如“受教育程度与人们的职业获得的研究”、“不同职业的被调查者收入的差异”-首先认为这些变量之间存在因果
6、关系。研究的目的在于辨明这些研究的因果关系状态,(4)相关的类型,相关关系是一种数量关系上不很严格的相互依存关系。如果这种关系近似地表现为一条直线,就称为直线相关,又称线性相关;如果这个关系近似地表现为一条曲线,则称为曲线相关,又称非线性相关。虽然在自然界和社会生活中,曲线相关现象远比直线相关更多,但由于数学手段上的局限性,社会统计研究中多以阐述线性(直线)相关为主。,如何来测量相关系数呢?有两个标准:选用统计值有意义的相关测量法,在统计学中有一组相关测量法,具有消减误差比例的意义,称为PRE测量法要注意变量的不同层次,属于不同测量层次的变量,就要用不同的相关测量法。,(5)削减误差比例,可以
7、表示两个变量间关系的强弱消减误差比例(PRE测量,Proportionate reduction in error):我们在预测或解释社会现象y时,难免会有误差(错误),假定另一种社会现象x与y是有关系的,我们可以根据x的值来预测y的值,理应可以减少若干误差,其值表示的就是x对y的误差的消减程度,理解:x对y的可认知程度,如假定不知道x的值,我们在认识y时的全部误差是E1。我们知道x的值,可以根据x的值来认识y的值时的误差的总数(不可认知的部分)为E2,那么用x的值来预测y的值时减少的误差就是E1-E2,这个值( E1-E2 )与y全部误差的比例,则称谓消减了的误差比例,Y右图红色表示E1-E
8、2,,E1,PRE的数值越大,表示以x值预测y值时,减少的误差所占的比例越大,说明x与y的关系越强。,PRE值的意义:,1、PRE的值在0,12、E2=0,则PRE=1,x与y是全相关,用x解释y时不会产生误差3、E1=E2,则PRE=0,x与y是无相关,用x来预测y时产生的误差等于不用x来预测y时的误差4、如PRE=0.8,表示用x预测y可以减少80%的误差,也反映了两者的相关程度颇高;如果PRE=0.08,则表示只能减少8%的误差,即x对y的影响甚小,需要寻找其他的变量解释或预测y,强调:PRE值的两个意义,用一个变量预测另一个变量能消减的误差比例两个变量之间关系的大小,学习提示:,鉴于大
9、家的基础,本次课大家把握以下几点:不需要在公式的推演和具体的计算上下功夫,这些用软件就可以操作。必须记牢不同的变量层次对应的相关测量法(即相关系数统计量)必须理解各种相关系数的意义并能解释计算出的结果,二、交互分类表与列联表,交互分类就是将调查所得的一组数据按照两个不同的变量进行综合分类。通常以交互分类表(列联表)的形式出现,如表1:,交互分析的作用,如表3,我们只能得出赞成和反对的人大致相等的结论,实际从不同性别来看,男性和女性之间存在很大的差异,思考:两个表格所显示信息的差异,交互分析的作用,较为深入的描述样本资料的分布状况和内在结构。对变量之间的关系进行分析和解释,交互分类表的形式要求,
10、每个表的顶端要有表号和标题线条规范、简洁,最好不用竖线百分比符号的处理:一种在表顶端的右角;另一种在表中每一列数字的上方表的下端用括号标出每一列的频数两个变量的安排:通常是将自变量、或被看作自变量或用来做解释的变量放在上面(列),将因变量、或被看作因变量、或被解释的那个变量放在表的左侧(行)。变量取值不宜太多。如4个自变量,5个因变量就是20个百分比少数点的位数要一致。如67.3和50.0必须要进行假设检验(多选变量的分析可以没有),课堂提问,1.交互分类表(即列联表)的作用是什么?2.相关的性质是什么?(三个方面)3.为什么说PRE测量法可以反映两个变量之间关系的强弱?,三、相关测量法,相关
11、测量法,是用一个统计值来表示变量和变量之间的关系。这个统计值,通常称为相关系数(coefficient of association)。相关测量法有很多种,在进行选择时,主要依据以下法则:两个变量的测量层次;两个变量的影响方向(是否对称);尽可能选择有消减误差比例意义的相关测量法。,尽可能用PRE测量法:社会学不但要描述社会现象,最重要的是要解释和预测社会现象。研究中之所以要探讨两个变量之间的关系,是为了减少解释或预测时的错误。消减误差比例,就是用一个变量x预测另一个变量y时消减的误差的量化测量。因此,在测量两个变量之间的关系时,应尽可能选择有消减误差比例意义的测量方法。,另外,在测量两个变量
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第三 变量 分析 ppt 课件
链接地址:https://www.31ppt.com/p-1627048.html