HLM多层线性模型简介.ppt
《HLM多层线性模型简介.ppt》由会员分享,可在线阅读,更多相关《HLM多层线性模型简介.ppt(69页珍藏版)》请在三一办公上搜索。
1、多层线性模型简介 Introduction to HLM,北京师范大学心理学院刘红云,主要内容,为什么要用多层线性模型?回归分析模型回顾多层(多水平)数据特点什么是多层线性模型?HLM发展HLM数学模型HLM常见简化模型两水平模型应用举例应该注意的问题,回归分析模型,回归分析模型的假设,线性(Linearity)误差正态分布(normally distributed)误差方差齐性(homoskedastic)误差或观测个体之间相互独立(independent),什么是多层(多水平)数据?,多层(多水平)数据指的是观测数据在单位上具有嵌套的关系。如学生嵌套于班级,班级嵌套于学校等。同一单位内的观
2、测,具有更大的相似性。同一个班级的学生由于受相同的班级环境等因素的影响有更大的相似性。,嵌套于背景(contextual)特征的多层数据举例,学生水平特征的观测,嵌套于班级或学校兄弟姊妹特征的观测,嵌套于家庭个体之间的观测嵌套于社区个体不同时间点的重复测量嵌套于个体病人嵌套于医院参数的估计嵌套于不同的研究(元分析,meta-analysis),对多层数据,我们了解什么.,随机选取两个观测,同一组内的观测之间的相似性要比不同组观测之间的相似性大;如果回归模型不能解释所有的组间的差异(事实上传统回归不可能做到这一点),那么同一组内的观测之间的误差可能相关;这就违背了传统回归(OLS)中关于残差相互
3、独立的假设;至少,传统回归分析得到的标准误的估计不正确(太小)。,HLM数据特点,对于嵌套数据,传统回归模型的做法:(1)个体(如学生)水平上分析 问题:同一班级的学生间相互独立的假设是不合理的,同样对不同班级的学生和相同班级的学生作同一假设也是不合理的。(2)组(如学校)水平上分析 问题:丢失了班级内学生个体间的差异的信息。,HLM数据特点,对于嵌套数据,传统回归分析的假设往往无法满足。传统的线性回归模型假设变量间存在直线关系,因变量总体上服从正态分布,方差齐性,个体间相互独立。前两个假设较易保证,但方差齐性,尤其是个体间相互独立的假设却很难满足。,独立性不满足带来的问题,传统回归系数估计的
4、标准误依赖于相互独立的假设;如果独立性的假设不满足,得到的标准误的估计往往偏小,因此所犯第一类错误的概率往往偏大。,HLM数学模型,例如:对73个学校1905名学生进行调查,目的是考虑其刚上高中时的入学成绩与三年后高考成绩之间的关系。考虑方法:(1)如果用传统的线性回归分析,直接在学生水平上进行分析,得出入学学业成绩对高考成绩之间的一条回归直线,如下图1所示,从图1的结果可以看出,传统回归分析没有区分不同的学校之间的差异。,图1:不考虑学校之间差异的回归直线,HLM数学模型,(2)如果将数据进行简单合并,用每个学校学生的平均成绩代替这个学校的成绩,直接在学校水平上估计入学成绩对高考成绩的影响,
5、得到一条回归直线,如图2所示,这种方法忽略了不同学生之间的差异;,图2:只考虑学校差异忽略学生差异回归直线,HLM数学模型,(3)如果假设不同学校入学成绩对高考成绩的回归直线截距不同,斜率相同(平均学习成绩之间存在差异),得到如图3的结果,从图中结果可以看出,不同学校学生平均高考成绩之间存在差异。,图3:考虑不同学校平均成绩差异的回归直线,HLM数学模型,(4)对73所学校分别做回归分析,得到如图4的结果,如图4所示,从图中结果可以看出,不同学校回归直线的截距和斜率均不同,即:不同学校学生平均高考成绩之间存在差异,入学学业成绩对高考成绩的影响强度不同。,图4:考虑不同学校平均成绩差异 和入学对
6、毕业成绩影响程度差异的回归直线,回归模型中,如何解决残差相关的问题?,希望定义一个模型,可以明确地允许因变量水平在组内和组间存在差异例如,允许学生的学业成绩存在学校之间的差异,告别 OLS:一个简单的多层线性模型,将重写为:,一个简单的多层线性模型,一个简单的多层线性模型,Outcome for observation i in unit j,一个简单的多层线性模型,Outcome for observation i in unit j,Intercept,一个简单的多层线性模型,Outcome for observation i in unit j,Intercept,Coefficient
7、,Value of X for observation i in unit j,一个简单的多层线性模型,Outcome for observation i in unit j,Intercept,Coefficient,Value of X for observation i in unit j,Residual term specific to unit j,一个简单的多层线性模型,Outcome for observation i in unit j,Intercept,Coefficient,Value of X for observation i in unit j,Residual
8、term specific to unit j,Residual term specific to observation i in unit j,一个简单的多层线性模型,Outcome for observation i in unit j,Intercept,Coefficient,Value of X for observation i in unit j,Residual term specific to unit j,Residual term specific to observation i in unit j,uj表示什么?,残差项定义第 j 组(第二水平)对于第 j组的所有观
9、测都相同只有下标 j,没有下标 i解释:总截距和第 j组的截距之间的差异,rij表示什么?,残差项定义第 j 组第i 个观测 均值为0,模型的特征,注意到:ij=uj+rij我们有:Var(ij)=Var(uj+rij)=Var(uj)+Var(rij)+2*Cov(uj,rij)=Var(uj)+Var(rij),模型的特征,Yij 的值可能存在第二水平(组间)的差异对于 uj和 rij没有定义其分布.X 和 Y 之间的关系不依赖于 j(1 不依赖于 j),模型的另一种表达,这里,多层线性模型,水平1(如:学生)水平2(如:学校),Yij-第j个学校的第i个学生,何谓多层线性模型?,多层线性
10、模型又称为:多水平分析(Multilevel Analysis)混合模型(Mixed Models)随机系数模型(Random Coefficient Models),HLM的发展,Harvey Goldstein-Multilevel Analysis(Mlwin)Stephen W.Raudenbush-Hierarchical Linear Model(HLM),HLM的发展,模型理论构想阶段(Lindley&Smith,1972),HLM的发展,2问题解决阶段 Dempster、Laird 和Rubin(1977)提出EM算法;Dempster(1981)将EM算法应用于解决多层线性模
11、型的参数估计;1983年,Strenio、Weisberg和Bryk等相继将这一方法应用于社会学的研究;1986年Goldstein应用IRGLS估计参数,1987年,Longford应用费歇得分算法对模型参数进行了估计。,HLM的发展,快速发展与应用 HLM(Bryk,Randenbush,SeltzerCongdon,1988);Mlwin(Rabash,ProsserGoldstein,1989);VARCL(Longford,1988);MPLUS(Muthen,1992)。,多层线性模型,回归模型的一种常用来回答背景变量(如班级环境等)与个体变量(如学生特征)之间的关系常用来估计组内
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- HLM 多层 线性 模型 简介

链接地址:https://www.31ppt.com/p-5433229.html