Logistic回归分析及其应用课件.ppt
《Logistic回归分析及其应用课件.ppt》由会员分享,可在线阅读,更多相关《Logistic回归分析及其应用课件.ppt(40页珍藏版)》请在三一办公上搜索。
1、2022/11/4,1,Logistic回归分析及其应用,温泽淮DME中心,2022/10/91Logistic回归分析及其应用温泽淮,2022/11/4,2,概述,1967年Truelt J,Connifield J和Kannel W在Journal of Chronic Disease上发表了冠心病危险因素的研究,较早将Logistic回归用于医学研究。一般概念一元直线回归多元直线回归,2022/10/92概述1967年Truelt J,Conn,2022/11/4,3,一元直线回归模型 y = a + b x + e多元直线回归模型 y = a + b1x1 + b2x2 + + bkx
2、k + e,2022/10/93一元直线回归模型,2022/11/4,4,-4.00,-2.00,0.00,2.00,4.00,X:自变量,0.00,0.25,0.50,0.75,1.00,F(y) :因变量的logit值,如果一定要进行直线回归也可以做出结果,但此时效果不佳。当自变量取一定值时,因变量的预测值可能为负数。,2022/10/94-4.00-2.000.002.004.,2022/11/4,5,一般直线回归难以解决的问题,医学数据的复杂、多样连续型和离散型数据医学研究中疾病的复杂性一种疾病可能有多种致病因素或与多种危险因素有关疾病转归的影响因素也可能多种多样临床治疗结局的综合性,
3、2022/10/95一般直线回归难以解决的问题医学数据的复杂,2022/11/4,6,简单的解决方法,固定其他因素,研究有影响的一两个因素;分层分析:按12个因素组成的层进行层内分析和综合。统计模型,2022/10/96简单的解决方法固定其他因素,研究有影响的,2022/11/4,7,寻找合适的模型,进行logit变换logit(p) = ln( ), p为y=1所对应的概率 logit(0.1) = ln( ) = ln(0.1/0.9),p,1 p,0.1,1 0.1,2022/10/97寻找合适的模型进行logit变换p1 ,2022/11/4,8,logit(p) = ln( ) p=
4、0或1时,此式失效 以 p = r/n 代之 logit(p) = ln (r + 0.5) / (n r + 0.5) 此称经验logistic变换 以Z代上式的logit(p), Z = a + b1x1 + b2x2 + + bkxk 称此为logistic回归模型,p,1 p,2022/10/98logit(p) = ln( ),2022/11/4,9,P = ez / (1 + ez ) ea+b1x1+b2x2+ +bkxk 1 + ea+b1x1+b2x2+ +bkxk此为非条件logistic回归模型 应用于成组数据的分析,P =,2022/10/99P =,2022/11/4
5、,10,自变量取定一些值时,因变量取0、1的概率就是条件概率,对条件概率进行logistic回归,称为条件logistic回归,表达式: eb1x1+b2x2+ +bkxk 1 - eb1x1+b2x2+ +bkxk 常用于分析配比的资料,P =,2022/10/910自变量取定一些值时,因变量取0、1的概,2022/11/4,11,概述小结,logistic回归对因变量的比数的对数值( logit值)建立模型因变量的logit值的改变与多个自变量的加权和呈线性关系因变量呈二项分布,2022/10/911概述小结logistic回归对因变量的,2022/11/4,12,分析的一般步骤,变量的编
6、码哑变量的设置和引入各个自变量的单因素分析变量的筛选交互作用的引入建立多个模型选择较优的模型模型应用条件的评价输出结果的解释,2022/10/912分析的一般步骤变量的编码,2022/11/4,13,1.变量的编码,变量的编码要易于识别注意编码的等级关系改变分类变量的编码,其分析的意义并不改变。牢记编码使用变量数值标识(value labels)记录编码内容,2022/10/9131.变量的编码变量的编码要易于识别,2022/11/4,14,变量的编码,变量名 变量标识 变量值 值标识 SEX 性别 1 男 2 女 EDU 教育程度 0 文盲 1 小学 2 初中及以上,2022/10/914变
7、量的编码变量名 变量标识,2022/11/4,15,variable labelsqnum 问卷序号rnum 录入序号pnum 病人编号hnum 住院号/门诊号chname 患者中文姓名drugroup 组别name 患者姓名sex 患者性别age 患者年龄,value labelssex 1 男 2 女/hisc 1 是 0 否 9 无法判断/nsex 1 正常 0 异常 9 未检/demdx 1 有 0 无/addx 0 无 1 危险性 2 可能 3 很可能/edu 0 文盲 1 小学程度 2 初中及以上,2022/10/915variable labelsvalu,2022/11/4,1
8、6,2.哑变量的设置和引入,哑变量,又称指示变量或设计矩阵。有利于检验等级变量各个等级间的变化是否相同。一个k分类的分类变量,可以用k-1个哑变量来表示。,2022/10/9162.哑变量的设置和引入哑变量,又称指示,2022/11/4,17,哑变量的设置,教育程度:文盲,小学,初中,高中以上,2022/10/917哑变量的设置教育程度:文盲,小学,初中,2022/11/4,18,以高中作为参照,2022/10/918以高中作为参照,2022/11/4,19,SPSS提供的方法,Indicator: 默认。以第1 或最后1类作对照,其他每类与对照比较;Sample: 以第1 或最后1类作对照,
9、其他每类与对照比较,但反映平均效应。Difference: 除第1类外各分类与其前各类平均效应比较;Helmert: 除最后1类外各分类与其前各类平均效应比较;Repeated: 除第1类外各分类与其前一类比较;Polynomial: 假设类间距相等,用于数值型变量。Deviation: 以第1 或最后1类作对照,其余每类与总效应比较。,2022/10/919SPSS提供的方法Indicator:,2022/11/4,20,3.自变量的单因素分析,了解自变量与因变量的分布检验是否符合建立模型的应用条件偏离应用条件时,进行数据变换各个自变量两组间的比较计数资料计量资料双变量分析,2022/10/
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Logistic 回归 分析 及其 应用 课件
链接地址:https://www.31ppt.com/p-1286261.html