第16章 logistic回归.ppt
《第16章 logistic回归.ppt》由会员分享,可在线阅读,更多相关《第16章 logistic回归.ppt(114页珍藏版)》请在三一办公上搜索。
1、第十六章 logistic回归分析,陈 炳 为,2023/11/18,2,多元线性回归回顾,1 模型的建立=a+b1X1+bnXn资料中要求:Y变量服从正态分布 X变量为可精确测量,2023/11/18,3,2 模型的检验:(1)方程的检验 方差分析法、决定系数、复相关系数(2)自变量检验的方法 偏回归平方和、t检验、标准化回归系数3 自变量选择方法(1)全局择优法(2)逐步选择法 前进法、后退法、逐步回归法4 SPSS操作,2023/11/18,4,资料的分类,2023/11/18,5,基本概念,1 病例对照研究(case-control study)、队列研究(cohort study)2
2、 暴露(exposure)3 优势比,比数比(odds ratio,OR),相对危险度(relative risk,RR),2023/11/18,6,危险度(risk):指发生某有害事件的概率。常用总体的发病率(incidence of a disease),患病率(prevalence rate),死亡率(death rate)表示。,2023/11/18,7,如吸烟者的肺癌患病率高,对一个在吸烟但没患肺癌的人可以说他的肺癌的危险性高。,2023/11/18,8,计算举例,例3-3某锡矿的矿工肺癌发病率308.39/10万,非矿工的肺癌发病率为25.48/10万,试计算发病的相对危险度。RR
3、=308.39/25.48=12.10注意:这是样本率计算得到的样本指标存在抽样误差;只有前瞻性研究(队列研究cohort)才能得到率的指标,因为观察了所有可能得病的样本或总体。所以该指标常用。,2023/11/18,9,优势odds与优势比odds ratio,优势(比势)为某病患者(或非患者)某暴露因素存在的比例P(E)和不存在的比例(1-P(E)的比例。,Odds=P(E)/1-P(E),2023/11/18,10,例:有人做宫外孕与腹部手术的病例对照研究,试问腹部手术史与宫外孕的发生是否有关?,2023/11/18,11,优势比odds ratio,OR,患者与非患者某因素优势的比值被
4、称作优势比(比数比)。OR=odds1/odds0,例 病人有腹部手术的优势 odds1=55/199=0.276非病人有腹部手术史的优势 Odds0=120/593=0.202 OR=odds1/Odds0=0.276/0.202=1.366,2023/11/18,12,2023/11/18,13,2023/11/18,14,OR值的95%CI公式:,95%CI:,2023/11/18,15,2023/11/18,16,混杂因素(confounding factor),定义:混杂因素指干扰了所研究的因素与疾病发生相关程度测定的非研究因素。如:抽烟与肺癌关系的研究中,若抽烟组年龄与不抽烟组的年
5、龄分布不同,则年龄就成为一个混杂因素。,2023/11/18,17,例:在心血管疾病与口服避孕药(OC)关系的研究中,年龄为一混杂因素,将年龄分为 岁和40岁两个层。计算调整年龄后,心血管疾病与OC使用的OR并做假设检验。(此数据为构造的)OR1=2,OR2=2,不调整年龄的OR23.45。,2023/11/18,18,混杂因素的判断,要从两方面考虑:(E为暴露因素,F为可疑混杂因素,D为疾病)(A)与暴露因素有关,但不是其结果。即:(B)在非暴露人群中,该因素是疾病发生的“危险因素”。,2023/11/18,19,2023/11/18,20,Mantel-Haenszel分层分析法,用于控制
6、一个或多个混杂因素,然后估计研究因素与疾病的相对危险度或比数比调整后的,2023/11/18,21,调整年龄后的OR值,不调整年龄的OR23.45,2023/11/18,22,SPSS执行,2023/11/18,23,SPSS结果,2023/11/18,24,2023/11/18,25,主要内容,1 logistic回归模型简介2 条件logistic回归3 多类结果的logistic回归4 有序结果的累计比数logistic回归5 logistic回归的应用及其注意事项,2023/11/18,26,1 logistic回归模型简介,Mantel-Haenszel方法的不足:1 只适用于分层层
7、次较少的情况,随着混杂变量的增加,可能会使格子出现少于0的情况。2 当暴露因素或混杂因素为连续型变量时,按等级分出现信息损失。1970年代发展起来的logistic回归可以克服上述弱点。,2023/11/18,27,Logistic回归的应用,1 病例对照研究 食管癌的发生与吸烟、饮酒、不良饮食习惯等危险因素。2 队列研究 研究腹泻与喂养方式的关系。追踪观察并比较不同喂养方式下的腹泻情况。,2023/11/18,28,1.1 模型简介,Y为二值变量,取值:,2023/11/18,29,P阳性结果发生的概率,0P1。1-P为阴阳性结果发生的概率。,Cox(1970)logit变换,2023/11
8、/18,30,为“机会”或“优势”(odds)logit P为优势之对数(log odds),2023/11/18,31,Logistic函数的图形,LogitP,2023/11/18,32,logistic回归模型的几种形式,2023/11/18,33,1.2 传统方法与logistic回归,四格表资料(病例对照)与logistic的关系分层四格表资料与logistic的关系,2023/11/18,34,例:腹部手术史与宫外孕的发生是否有关?,2023/11/18,35,X=1 表示有腹部手术X=0 表示没有腹部手术,2023/11/18,36,X=1时 X=0 时,2023/11/18,3
9、7,SPSS操作,2023/11/18,38,SPSS结果,2023/11/18,39,例 分层四格表资料与logistic回归,研究吸烟是否增加胰岛素依赖性糖尿病人患肾病有危险性,2023/11/18,40,SPSS操作,先定义权重:,2023/11/18,41,CMH卡方的操作,2023/11/18,42,Logistic回归,2023/11/18,43,SPSS两结果的比较,2023/11/18,44,传统方法与logistic回归的关系,单因素病例对照研究的OR,与logistic回归等价;分层病例对照研究的ORMH,与logistic回归结果近似。logistic回归是传统方法的扩展
10、。,2023/11/18,45,混杂因素的控制,在logistic模型中,控制某混杂因素,实际上就是将该因素纳入模型。在解释暴露因素的影响时,该混杂因素实际上是控制了。,2023/11/18,46,1.3 回归系数的解释,1 回归系数的解释:一个暴露因素时,当暴露为1,非暴露为0时,ln(OR),2023/11/18,47,一个暴露因素:暴露为1,非暴露为0。一个混杂因素时:水平数分别为:1,2,,当x2固定时(取某个值的前提下):,2023/11/18,48,一个暴露因素时,当暴露为c1,非暴露为c0时,,2023/11/18,49,2 截距的解释,令,2023/11/18,50,截距的意义
11、,在横断面调查研究中,表示基线状态下,个体患病率的比数的对数值;在队列研究中,有下式成立:,2023/11/18,51,例 胃癌危险因素研究,食管癌与吸烟及饮酒间的关系。,2023/11/18,52,=-0.9909表示不吸烟且不吸酒的人患食管癌与不患食管癌概率之比的对数1=0.8856,exp(1)=2.42,表明控制饮酒因素后,吸烟者与不吸烟者相比,患食管癌的比数比为2.42。2=0.5261,exp(2)=1.69,表明控制吸烟因素后,饮酒者与不饮酒者相比,患食管癌的比数比为1.69。,2023/11/18,53,等级变量:一般以最小等级或最大等级作为参考组,并按等级顺序依次取为0,1,
12、2,。此时,exp()表示X增加一个等级时的优势比,exp(k)表示增加k个等级时的优势比。连续性变量:表示增加1(个计量单位)时的优势比。,2023/11/18,54,多分类变量:哑变量(dummy variable)x1时:x10,x20,x30 表示A型血x2时:x11,x20,x30 表示B型血x3时:x10,x21,x30 表示AB型血x4时:x10,x20,x31 表示O型血exp(1)表示B与A比之OR;exp(2)表示AB与A比之OR;exp(3)表示O与A比之OR。,2023/11/18,55,极大似然法的基本思想,先看一个简单例子:,一只野兔从前方窜过.,是谁打中的呢?,某
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第16章 logistic回归 16 logistic 回归
链接地址:https://www.31ppt.com/p-6617211.html