数据分析方法与结构方程模型ppt课件.ppt
《数据分析方法与结构方程模型ppt课件.ppt》由会员分享,可在线阅读,更多相关《数据分析方法与结构方程模型ppt课件.ppt(94页珍藏版)》请在三一办公上搜索。
1、专题8 结构方程模型(SEM),主要内容,SEM基本理论(变量内涵、数学表示、路径图)SEM的适用范围SEM的检验指标SEM的检验结果SEM的应用步骤AMOS软件的基本应用,结构方程模型简介,什么是结构方程模型,结构方程模型(SEM-Structural Equation Modeling)是一门基于统计分析技术的研究方法学,用以处理复杂的多变量研究数据的探究与分析。是一种建立、估计和检验因果关系模型的多元统计分析技术。一般而言,结构方程模式被归类于高等统计学,属于多变量统计(multivariate statistics)的一环,但是由于SEM有效整合了统计学的两大主流技术“因子分析”与“路
2、径分析”,应用范围广泛,因此在Karl Jreskog于1970年代提出相关概念,并首先发展分析工具LISREL软件后,有关SEM的原理讨论与技术发展便蔚为风潮,普遍成为社会与行为科学研究者必备的专门知识之一。 美国心理学会于2000年所出版的多变量统计读本(Reading and Understanding More Multivariate Statistics)中,有两个专门章节在介绍SEM;此外,由Tabachnick&Fidell所撰写的多变量分析的经典著作Using Multivariate Statistics,于第四版(2001)以专章详细介绍SEM的原理与应用。,目前,关于结
3、构方程模式的专门著作不断涌现,分析软件亦不断开发更新,出现了数套专门应用于SEM分析的软件包,例如LISREL、EQS、AMOS、MPLUS、CALIS、RAMONA等。这些分析工具多已能搭配窗口软件与文书操作系统,使得结构方程模式的分析效能大为提升,报表呈现与绘图作业简化且美观,更能够结合因特网的编辑规格(HTML格式),快速将结构方程模式的分析结果整理与传播。,学术研究,根据Hershberger(2003)检阅1994至2001年间的相关文献发现,不论在刊登结构方程模式相关论文的期刊数、期刊论文的数量、结构方程模式所延伸出来的多变量分析技术等各方面,均有大幅度成长,显示SEM方法已是一门
4、发展成熟且高度受到重视的学问与技术。SEM拥有专属期刊结构方程模式(Structural Equation Modeling),专门刊登与SEM有关的论文与实证研究,心理学界的重要典籍心理学年度评论(Annual Review of Psychology)也于1996年与2000年两度刊登了介绍结构方程模式相关文献的专文。美国社会学会出版的社会方法学(Sociological Methodology)与社会学方法与研究(Sociological Methods and Research),以及美国心理学会的心理学方法(Psychological Methods)期刊,每一卷也有相当篇幅有关结构
5、方程模式的应用的论文。,发展渊源,从统计学与方法学的发展脉络来看,结构方程模式并不是一个崭新的技术,而是因子分析(factor analysis)与路径分析(path analysis)两种在社会与行为科学非常重要的统计技术的结合体。相对于这两大分析技术的发展轨迹,Kaplan(2000)指出SEM的历史根源系来自两个重要的计量学门类:心理计量学与经济计量学,这两个学术领域对于SEM的发展有着重要的影响。,Structural Equation Model,SEM Covariance Structure Modeling,CSM Linear Structural Relationship
6、, LISREL 从上述名称中可以看出,结构方程模型的几个本质特征是: 结构、协方差、线性,结构方程模型的含义,SEM的基本原理,SEM基于方差协方差矩阵而不是基于相关系数矩阵分析的一种统计技术)它是在设定的模型下,推导出一个基于该设定模型的方差协方差矩阵,使矩阵中的每个元素都尽可能的接近于样本中观测变量的方差协方差矩阵S中的相应元素。如果设定模型正确, 将非常近似于S。,结构方程模式的基本程序,一、为何要用结构方程模型?,很多社会、心理研究中所涉及到的变量,都不能准确、直接地测量,即潜变量,如工作自主权、工作满意度、道德水平、智力,社会资本,社会经济发展的和谐度等。这时,只能用一些外显指标,
7、去间接测量这些潜变量。如用工作方式选择、工作目标调整作为工作自主权(潜变量)的指标,以目前工作满意度、工作兴趣、工作乐趣、工作厌恶程度(外显指标)作为工作满意度的指标。传统的统计分析方法(如Spss/Eviews)不能妥善处理这些潜变量,而结构方程模型则能同时处理潜变量及其指标。,SEM的四种变量,在SEM中,不存在任何一个单箭头指向的变量为外生变量,外生变量具有方差参数(variance parameter),外生变量之间只能用双箭头连接,代表两者的方差。至少存在一个单箭头指向的变量为内生变量,表示它至少为系统内的部分原因所造成的。内生变量不存在方差参数(它可用模型中的其它参数来表示)。内生
8、变量之间及内生变量与外生变量之间不能用双箭头来表示两者之间的关系。内生变量存在误差项(error terms)。误差项具有方差参数。,SEM的变量,设置潜在变量的刻度(Scale)存在两种方法:设定相应的相关系数(coefficient)的值为1。这意味着潜在变量的刻度与指标(indicator)的刻度一致。设定潜在变量的方差为1,这意味着该变量被标准化。鼓励采用这种方法,它可以简化对其它参数的解释,变量之间的路径也可以解释为标准化的回归相合系数(单方向的路径)和相关系数(双向路径)(因子分析通常采用这种方法)。,SEM的变量,回归分析与结构方程模型的比较,假如有五道题目来测量外向型性格,还有
9、四道题目来测量自信。研究自信与外向型性格的关系。假如是你,你将怎样来进行研究?回归分析的做法:先分别计算外向题目的总分(或平均分)和自信题目的总分(或平均分),在计算两个总分的相关。这样的计算所得的两个潜变量(性格与自信)的关系,恰当吗?,线性回归模型及其局限性,1)无法处理因变量(Y)多于一个的情况;2)无法处理自变量(X)之间的多重共线性;3)无法对一些不可直接测量的变量进行处理,主要是一些主观性较强的变量进行测量。如幸福感、组织认同感、学习能力等;4)没有考虑变量(自变量、因变量)的测量误差,以及测量误差之间的关系,多元统计方法中的相关解决方法,针对1):路径分析(Path Analys
10、is)缺点:分开考察不同的因变量,无法考察因变量之间的关系且缺少整体的视角 针对2):偏最小二乘法(PLS)缺点:相关理论尚不完善,解释力较弱。针对3):指标赋予权重,进行综合评价,得出一个量化的指标缺点:权重设计,需要相当的技巧,通常的方法,如AHP,模糊综合评判等方法缺少信度与效度针对4):没有办法解决,结构方程模型(SEM)的优点,1、同时处理多个因变量2、容许自变量和因变量含测量(误差传统方法(如回归)假设自变量没有误差)3、同时估计因子结构和因子关系4、容许更大弹性的测量模型5、估计整个模型的拟合程度(用以比较不同模型)6、SEM包括:回归分析、因子分析(验证性因子分析、 探索性因子
11、分析)、t检验、方差分析、比较各组因子均值、交互作用模型、实验设计,结构方程模型的基本概念,从可观测性角度分:显变量潜变量显变量(manifest variable):可直接观察并测量的变量,又称观测变量(observed variable)或再因子分析中也称为指标(indicator)潜变量(latent variable):不能直接观察的变量。相当于因子分析中的因子(factor),结构方程模型的基本概念,从变量生成的角度分: 外生变量内生变量外生变量(exogenous variable):在模型中不受其他变量影响的变量,相当于自变量的概念内生变量(endogenous variable
12、):在模型中受其他变量影响的变量,在SEM中又有两种内生变量,一种是相当于回归分析中的纯粹因变量,一种是中介变量(mediating variable)。,结构方程模型的基本概念,SEM路径图的主要元素:方框表示显变量,常标以x,y圆圈表示潜变量,常标以,外生显变量误差、内生显变量误差、内生潜变量均画在方框圆圈外相应位置,外生潜变量无误差各元素间均有箭头线连接单向直线箭头表示一个变量对另一个变量的直接影响双向曲线箭头表示相关关系,但这种相关关系未必是因果关系,因果关系模型 & 路径分析,对具有复杂因果关系的社会科学研究,普通的回归分析太简单而无法满足要求。,典型的模型,测量方程,结构方程模型分
13、为:测量方程(measurement equation)测量方程描述潜变量与指标之间的关系,如工作方式选择等指标与工作自主权的关系;,工作自主权,工作方式选择,工作目标调整,工作满意度,目前工作满意度,工作兴趣,工作乐趣,工作厌恶程度,结构方程,结构方程(structural equation),描述潜变量之间的关系,如工作自主权与工作满意度的关系。,工作自主权,工作满意度,测量模型的数学表示,对于指标与潜变量(例如两个工作自主权指标与工作自主权)间的关系,通常写为以下测量方程:其中:x外源指标(如两个工作自主权指标)组成的向量; y内生指标(如四个工作满意度指标)组成的向量; 外源潜变量(如
14、工作自主权等)组成的向量; 内生潜变量(如工作满意度等)组成的向量; 外源指标与外源变量之间的关系(如两个工作自主权指标与工作自主权的关系),是外源指标在外源潜变量上的因子负荷矩阵; 内生指标与内生变量之间的关系(如四个工作满意度指标与工作满意度的关系),是内生指标在内生潜变量上的因子负荷矩阵;,结构模型的数学表示,对于潜变量间(如工作自主权与工作满意度)的关系,通常写成如下结构方程:其中:B内生潜变量间的关系(如其它内生潜变量与工作满意度的关系); 外源潜变量对内生潜变量的影响(如工作自主权对工作满意度的影响); 结构方程的残差项,反映了在方程中未能被解释的部分。,潜变量间的关系,即结构模型
15、,是研究的兴趣重点,所以整个分析也称结构方程模型。,例,外生潜变量,内生潜变量,SEM的估计方法,模型估计(model estimation):模型参数可以采用几种不同的方法来估计。最常用的方法是最大似然法(ML)和广义最小二乘法(GLS)。,Amos中主要符号的说明,SEM的检验指标,卡方检验值,模型的评价(检查模型的准确性和简洁性),1、2指数:当前的许多模型拟合指数大部分都是以2为基础的。2越大,再生矩阵和样本协方差矩阵的差异越大,这时认为模型与数据拟合不好。 2如果取得较小的值(一般高于0.05的显著水平),暗示实际的和预测的输入矩阵没有显著差异,因此在假设的模型和实证数据之间有着较好
16、的拟合度。然而,2经常对样本量过于敏感,尤其是样本量超过200时(Hair et al.,1992)。事实上,一个理想的拟合指数,应该体现三个特征:与样本容量N无关、惩罚复杂模型、对误设模型敏感。2、 拟合优度指数(Goodness of fit index):主要包括GFI、AGFI。 GFI可以理解为假设的模型能够解释的方差和协方差的比例的一个测度。在计算这个指数时,如果考虑参数的数量,则由此产生的指数称为调整拟合指数(AGFI)。这类指数越高,表示模型拟合越好。GFI、AGFI早期使用较多,后来发现存在一些问题,一些研究发现即使拟合的模型离真模型,这两个直往往也很高。,SEM的检验指标,
17、3、相对拟合指数(Comparative Fit Index):主要包括规范拟合指数NFI(Normed Fit Index)、非规范拟合指数NNFI(non-normed fit index)和相对拟合指数CFI(Comparative Fit Index )。NNFI常常会因样本的波动超出01范围,从而不易判断拟合优度,而NFI则在01范围取值,不过NFI受样本量的影响较大,在样本量少的时候会低估拟合程度。近期一些文献反而更青睐NNFI。CFI在SEM软件中比较常用,取值在01之间。一些实证研究表明,CFI受样本量的影响较小,能够敏感地反映误设模型的变化,不过CFI没有惩罚复杂模型,因为它
18、没有对模型复杂性作出修正。4、简约拟合指数(parsimony fit index):惩罚复杂模型是SEM模型方法的重要原则。简约拟合指数是绝对拟合和相对拟合指数衍生的拟合指数,但是应用范围不广。目前在一些文献有涉及到,较常用的有PRNI、PGFI等。5、平均平方残差的平方根(RMR-Root Mean-Square Residual):观察的输入矩阵和估计矩阵之间残差的平均数的平方根 ,RMR的值越小,模型的拟合度就更好。 (近期许多文献更倾向于用RMSEA,即近似误差均方根,取值范围为0-1,越小越好),检验指标的大拇指法则,2/df指标:按照Carmines和Mciver的观点(1981
19、),卡方与自由度之比率应该不大于3,但Wheaton等人(1977)认为该指标小于5也可以接受。一般认为该指标最好不要超过3,在此范围内,模型良好。 GFI指标:该指标的取值范围在01.0之间,越接近1.0越好,一般性的,该指标大于0.90就可表示模型拟合良好。 AGFI指标:该指标的取值范围在01.0之间,越接近1.0越好,一般性的,该指标大于0.90就可表示模型拟合良好。 NFI指标:该指标的取值范围在01.0之间,越接近1.0越好,一般性的,该指标大于0.90就可表示模型拟合良好。 CFI指标:该指标的取值范围在01.0之间,越接近1.0越好,一般性的,该指标大于0.90就可表示模型拟合
20、良好。 RMR指标:该指标越近0越好,一般性的,该指标小于0.05就可表示模型拟合良好,但有的学者认为该指数小于0.10也可以接受(黄文仙,2000)。,结构方程建模和分析步骤,纯粹验证(strictly confirmatory,SC)心目中只有一个模型去拟合一个样本数据,整个分析的目的在于验证模型是否拟合样本数据,从而决定是接受还是拒绝该模型。这类在实际分析中并不多,因为无论接受还是拒绝,作者都希望有更佳的选择。选择模型(alternative models,AM)提出数个不同的模型(替代性模型或竞争性模型),从各模型拟合样本数据的优劣,决定那个模型最为可取。这类分析较SC多,但似乎觉得有
21、些麻烦,因此我们常做一些轻微修改,成为产生类模型的分析。产生模型(model generating,MG)应用最广。首先提出一个或多个基本模型,检查这些模型是否拟合样本数据。基于理论或数据,找出模型中拟合欠佳的部分。修改模型,通过同一或其他样本,检查修正模型的拟合程度,整个分析过程的目的在于产生一个最佳模型。,一、验证模型与产生模型,因此,SEM除了用来做验证模型和比较不同模型外,还可用来评估模型和修正模型。在使用SEM方法的管理学文献中,许多研究者往往从一个预设模型开始,将此模型与数据互相印证。如果发现预设模型与样本数据拟合不好,则将预设模型进行修正,增添或去除某些相关关系路径,然后再验证。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 分析 方法 结构 方程 模型 ppt 课件

链接地址:https://www.31ppt.com/p-1340892.html