logistic回归-周虹.ppt
《logistic回归-周虹.ppt》由会员分享,可在线阅读,更多相关《logistic回归-周虹.ppt(50页珍藏版)》请在三一办公上搜索。
1、Logistic 回归Logistic Regression,公共卫生学院妇女与儿童青少年卫生学系周虹,多元线性回归分析:用来分析多个自变量与一个因变量的关系;模型中因变量Y是连续性随机变量,并要求服从正态分布。但是,在医学研究中,常碰到因变量为非连续性变量的情况。,常见的有三类:,二项分类:如药物实验中,动物出现死亡或生存,人群中某种疾病的患病与未患病,临床实验中药物的有效与无效等。多项有序分类:如某一药物的治疗结果是治愈、显效、有效、无效。多项无序分类:如研究肝炎的类型,分为甲、乙、丙、丁、戊型等。Logistic回归(疾病的病因分析),Logistic回归分析,主要用于因变量是分类变量的
2、回归分析。根据因变量分类的不同,常分为:-因变量为二分变量的Logistic回归;-因变量为多分类变量的Logistic回归。(有序多分类、无序多分类)此外还有用于分析匹配资料的条件Logistic回归等。研究对象未经过匹配的非条件Logistic回归和研究对象经匹配的条件Logistic回归。,一、Logistic回归模型,0为常数项或截距;1,2.m分别为m个自变量的回归系数。,Logit变换(也称对数单位转换),P为发病概率,取值0-1;1-P为不发病概率。,取值:-+,=,-4.00,-2.00,0.00,2.00,4.00,Z,0.50,1.00,Logistic回归模型的函数,P,
3、Logistic function 取值 0-1,可描述/预测概率,Logistic 模型是概率模型 Logistic function 呈S-形曲线,符合流行病学对危险因素与疾病风险关系的认识,Logistic回归模型特点:,Logistic回归的自变量(影响因素),-可以是连续变量,也可以是分类变量。,-如果自变量中有分类变量,应以数字表示不同分类,如:“吸烟状况”为自变量,可以:=表示吸烟=0 表示不吸烟。,二、回归模型参数的意义,单纯从数学上讲,与多元线性回归分析中回归系数的解释并无不同,亦即m表示Xm改变一个单位时,因变量的平均变化量,与衡量危险因素作用大小的比值比(OR)有一个对应
4、的关系。,模型中回归系数:,常用于解释病例对照研究中的OR,病例对照研究:是以确诊患有某特定疾病的病人作为病例,以不患有该病但具有可比性的个体作为对照,搜集既往可能的危险因素的暴露史,并通过统计学方法,评估暴露因素与疾病之间是否存在统计学上的关联。常用于疾病病因的探索。,例:口服避孕药(OC)与心肌梗塞(MI)关系,-统计学检验 X2=7.70,p0.01 结论为拒绝无效假设,即两组暴露率差异有统计学意义。,比值比(Odds ratio,OR):考察关联强度大小,即暴露组的疾病危险性为非暴露组的多少倍。定量描述危险因素与疾病之间的关系。,比值 Odds=P/(1-P)比值比OR=P/(1-P)
5、/P/(1-P),设P表示暴露因素下个体发病的概率,则发病的概率P与未发病的概率1-P 之比为比值。,比值比 Odds Ratio,Odds=P/(1-P)暴露组:P=a/(a+b)1-P=b/(a+b)Odds=a/b非暴露组:P=c/(c+d)1-P=d/(c+d)Odds=c/d,OR1,疾病的危险度因暴露而增加;OR1,疾病的危险度因暴露而减少;OR=1,疾病的发生与暴露无关。本例,OR=2.195,说明口服避孕药患心肌梗塞的危险是没有口服避孕药的2.195倍。,当一种病的死亡率(或发病率)近似于零时,1-P1,则有:ORP1/P0=RR,RR为相对危险度,Logistic回归系数与O
6、R的关系:,有Logistic回归模型:如果要分析其中X2(假设是口服避孕药)变化一个单位对于 的影响程度,可以计算当分别为(X2+1)和时 的值,并计算其比值,此时其它变量保持相同,如下表:,Logistic回归系数与OR的关系:,暴露:,非暴露:,例:log odds(Y=1)=-4.353+0.038 age,:妇女是否患有骨质疏松,Y=1为是,Y=0为否,当年龄为a时,odds(Y=1|age=a)=exp(-4.353+0.038 a)当年龄为a+1,odds(Y=1|age=a+1)=exp(-4.353+0.038(a+1)Odds ratio=exp(0.038)=1.0387
7、年龄每增加一岁,患骨质疏松的可能性增加3.87%,Logistic回归方程求解参数采用最大似然估计法(Maximum likehood estimate)似然函数值(L)表达的是一种概率,即在假设拟合模型为真实情况时,能够观察到某一特定样本数据的概率,这个函数值在(0,1)之间。因为对这个函数值取自然对数后在数学处理上更为方便,而且又因为这个函数值是个极小的小数,其对数值是负数,所以通常用-2lnL表示函数的大小。,三、模型中的参数估计,四、模型检验和评价,1、对模型回归系数整体的检验:检验模型中所有自变量整体看是否与所研究事件的对数比值比存在线性关系-似然比检验(likehood ratio
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- logistic 回归 周虹
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-6511444.html