对数线性模型及SPSS操作ppt课件.pptx
《对数线性模型及SPSS操作ppt课件.pptx》由会员分享,可在线阅读,更多相关《对数线性模型及SPSS操作ppt课件.pptx(49页珍藏版)》请在三一办公上搜索。
1、对数线性模型,多项分布对数线性模型Poisson对数线性模型,2,高维列联表和多项分布对数线性模型,前面例子原始数据是个三维列联表,对三维列联表的检验也类似。但高维列联表在计算机软件的选项可有所不同,而且可以构造一个所谓(多项分布)对数线性模型(loglinear model)来进行分析。利用对数线性模型的好处是不仅可以直接进行预测,而且可以增加定量变量作为模型的一部分。,3,多项分布对数线性模型,现在简单直观地通过二维表介绍一下对数线性模型,假定不同的行代表第一个变量的不同水平,而不同的列代表第二个变量的不同水平。用mij代表二维列联表第i行,第j列的频数。人们常假定这个频数可以用下面的公式
2、来确定:,这就是所谓的多项分布对数线性模型。这里i为行变量的第i个水平对ln(mij)的影响,而j为列变量的第j个水平对ln(mij)的影响,这两个影响称为主效应(main effect);ij代表随机误差。,4,多项分布对数线性模型,这个模型看上去和回归模型很象,但由于对于分布的假设不同,不能简单地用线性回归的方法来套用(和Logistic回归类似);计算过程也很不一样。当然我们把这个留给计算机去操心了。只要利用数据来拟合这个模型就可以得到对于参数m的估计(没有意义),以及ai和bj的“估计”。有了估计的参数,就可以预测出任何i,j水平组合的频数mij了(通过其对数)。注意,这里的估计之所以
3、打引号是因为一个变量的各个水平的影响是相对的,因此,只有事先固定一个参数值(比如a1=0),或者设定类似于Sai=0这样的约束,才可能估计出各个的值。没有约束,则这些参数是估计不出来的。,5,多项分布对数线性模型,二维列联表的更完全的对数线性模型为,这里的()ij代表第一个变量的第i个水平和第二个变量的第j个水平对ln(mij)的共同影响(交叉效应)。即当单独作用时,每个变量的一个水平对ln(mij)的影响只有i(或j)大,但如果这两个变量一同影响就不仅是i + j ,而且还多出一项。这里的交叉项的诸参数的大小也是相对的,也需要约束条件来得到其“估计”;涉及的变量和水平越多,约束也越多。,6,
4、注意,无论你对模型假定了多少种效应,并不见得都有意义;有些可能是多余的。本来没有交叉影响,但如果写入,也没有关系,在分析过程中一般可以知道哪些影响是显著的,而那些是不显著的。,Poisson分布简介 在某些固定的条件下, 人们认为某些事件出现的次数服从Poisson分布, 比如在某一个时间段内某种疾病的发生病数, 显微镜下的微生物数, 血球数, 门诊病人数, 投保数, 商店的顾客数, 公共汽车到达数, 电话接通数等等. 然而, 条件是不断变化的. 因此, 所涉及的Poisson分布的参数也随着变化.,8,Poisson对数线性模型,假定哮喘发生服从Poisson分布;但是由于条件不同,Pois
5、son分布的参数也应该随着条件的变化而改变。这里的条件就是给出的性别、空气污染程度与年龄。当然,如何影响以及这些条件影响是否显著则是我们所关心的。这个模型可以写成,这里为常数项,i为性别(i=1,2分别代表女性和男性两个水平),j为空气污染程度(j=1,2,3代表低、中高三个污染水平),x为连续变量年龄,而为年龄前面的系数,ij为残差项。,SPSS 中一共提供了对数线性模型的三个过程: General 过程、Logit 过程和Model Selection 过程,三者都应用对数线性模型的基本原理,但在具体的拟和方法和结果输出上有些不同,分别用于不同的研究情况。General 过程适用于研究人员
6、只对某些特定效应项感兴趣的情况,属于证实性研究。General 过程的另外一个特点是,分析中只考虑因素之间是否相关,不考虑谁是原因谁是结果,最后在结果解释时才由研究人员来做出判断。如果因变量为两分类,就可以用Logit 过程提供的Logit 模型来分析。相比之下,它比另两个模型更像方差分析,明确分出了应变量和自变量,直接服务于分类变量之间的因果关系。Model Selection 过程拟合的是分层对数线性模型(Hierarchical Mode)。如果在探索性分析中研究人员只是设想若干分类变量之间可能有关系,但是并无明确假设,也没有具体分出哪个是因变量、哪个是自变量,此时比较适宜采用分层对数线
7、性模型分析。,9,对数线性模型- General模型,一般对数线性模型是对数线性模型中最简单的一种。例:某医科大学附属医院用内科疗法治疗一般类型胃溃病患者80 例,治愈63 例,治疗特殊类型胃溃病患者99 例,治愈31 例,试通过此资料比较用内科疗法治疗两种胃溃病病人所得的治愈率是否相同。影响格子中频数大小的因素有两个:组别和治疗结果,根据前面的分析可知,要比较两种类型胃溃疡病的治愈率是否相同,就是分析组别和治疗结果两个因素对单元格频数的作用是否存在交互作用。,10,可以认为用内科疗法治疗两种胃溃疡病人所得的治愈率是不同的。一般类型病人的治愈率高于特殊类型,或者可以说,治愈率和组别与治疗结果两
8、个因素有关,对单元格频数的作用存在交互作用。,11,拟合Poisson回归模型时使用,首先应当使用Weight Cases 过程,将count 指定为频数变量。,结果分析:,17,模型迭代的基本情况:允许最大迭代次数为20 次,用于判断收敛的相对容忍度为0.001,本模型迭代4次后即成功收敛。表格下方的脚注给出了具体模型的信息:单元格内频数服从多项分布,具体的模型如下,即含交互作用项的饱和模型。,这里关心的是参数6 的估计值及假设检验结果,即两个因素的交互作用是否有意义。其参数估计值为2. 095 ,P0. 05 ,认为胃溃疡类型和治疗结果两个因素之间存在交互作用,即不同胃溃疡类型有不同的治疗
9、率。结合具体资料可以看出,一般类型胃溃疡治愈率高于特殊类型。,输出的分别是4 个系数的协方差矩阵和相关系数矩阵。作为参照水平的参数(都赋值为0) 没有列出。再次提醒:由于拟合的是饱和模型,故所有的残差均为0 ,因此没有输出与残差有关的图形。,如果选择Custom模型,分析group和result两个因素的Main effect,不包含两者的交互效应,结果会怎样?,22,从模型的拟和优度检验可见,无论是似然比2 还是普通的Pearson 2 , P值都是小于0.05 的,从饱和模型中去除交互项后所用的这个模型在拟合优度上和原饱和模型有统计学差异,即被去除的交互项实际上是存在的。也就是两变量间有关
10、系,即不同类型胃溃疡病人的治愈率不同。这与饱和模型的分析结果是完全一致的。,4 个单元格的观察频数、期望频数和校正残差的散点图矩阵。上排中间的格子是指以期望频数横坐标、实际频数为纵坐标的散点图;第二排左边的散点图是以实际频数为横坐标、期望频数为纵坐标。如果把这两个图作一定的旋转,就会发现它们是完全一样的。从观察频数和校正残差的散点图可看出, 4 个散点明显存在着一定的趋势,这说明残差不服从正态分布,所拟合的模型尚不能完全解释4 个格子频数的分布规律,可能还有有意义的变量未被纳入(实际上就是交互项未被纳入)。,校正残差的正态Q-Q 图和去势正态Q-Q图,可见虽然只有4 个格子的残差,但明显存在着
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 对数 线性 模型 SPSS 操作 ppt 课件
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-1751856.html