欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    Logistic回归分析及其应用课件.ppt

    • 资源ID:1286261       资源大小:158.47KB        全文页数:40页
    • 资源格式: PPT        下载积分:20金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要20金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    Logistic回归分析及其应用课件.ppt

    2022/11/4,1,Logistic回归分析及其应用,温泽淮DME中心,2022/10/91Logistic回归分析及其应用温泽淮,2022/11/4,2,概述,1967年Truelt J,Connifield J和Kannel W在Journal of Chronic Disease上发表了冠心病危险因素的研究,较早将Logistic回归用于医学研究。一般概念一元直线回归多元直线回归,2022/10/92概述1967年Truelt J,Conn,2022/11/4,3,一元直线回归模型 y = a + b x + e多元直线回归模型 y = a + b1x1 + b2x2 + + bkxk + e,2022/10/93一元直线回归模型,2022/11/4,4,-4.00,-2.00,0.00,2.00,4.00,X:自变量,0.00,0.25,0.50,0.75,1.00,F(y) :因变量的logit值,如果一定要进行直线回归也可以做出结果,但此时效果不佳。当自变量取一定值时,因变量的预测值可能为负数。,2022/10/94-4.00-2.000.002.004.,2022/11/4,5,一般直线回归难以解决的问题,医学数据的复杂、多样连续型和离散型数据医学研究中疾病的复杂性一种疾病可能有多种致病因素或与多种危险因素有关疾病转归的影响因素也可能多种多样临床治疗结局的综合性,2022/10/95一般直线回归难以解决的问题医学数据的复杂,2022/11/4,6,简单的解决方法,固定其他因素,研究有影响的一两个因素;分层分析:按12个因素组成的层进行层内分析和综合。统计模型,2022/10/96简单的解决方法固定其他因素,研究有影响的,2022/11/4,7,寻找合适的模型,进行logit变换logit(p) = ln( ), p为y=1所对应的概率 logit(0.1) = ln( ) = ln(0.1/0.9),p,1 p,0.1,1 0.1,2022/10/97寻找合适的模型进行logit变换p1 ,2022/11/4,8,logit(p) = ln( ) p=0或1时,此式失效 以 p = r/n 代之 logit(p) = ln (r + 0.5) / (n r + 0.5) 此称经验logistic变换 以Z代上式的logit(p), Z = a + b1x1 + b2x2 + + bkxk 称此为logistic回归模型,p,1 p,2022/10/98logit(p) = ln( ),2022/11/4,9,P = ez / (1 + ez ) ea+b1x1+b2x2+ +bkxk 1 + ea+b1x1+b2x2+ +bkxk此为非条件logistic回归模型 应用于成组数据的分析,P =,2022/10/99P =,2022/11/4,10,自变量取定一些值时,因变量取0、1的概率就是条件概率,对条件概率进行logistic回归,称为条件logistic回归,表达式: eb1x1+b2x2+ +bkxk 1 - eb1x1+b2x2+ +bkxk 常用于分析配比的资料,P =,2022/10/910自变量取定一些值时,因变量取0、1的概,2022/11/4,11,概述小结,logistic回归对因变量的比数的对数值( logit值)建立模型因变量的logit值的改变与多个自变量的加权和呈线性关系因变量呈二项分布,2022/10/911概述小结logistic回归对因变量的,2022/11/4,12,分析的一般步骤,变量的编码哑变量的设置和引入各个自变量的单因素分析变量的筛选交互作用的引入建立多个模型选择较优的模型模型应用条件的评价输出结果的解释,2022/10/912分析的一般步骤变量的编码,2022/11/4,13,1.变量的编码,变量的编码要易于识别注意编码的等级关系改变分类变量的编码,其分析的意义并不改变。牢记编码使用变量数值标识(value labels)记录编码内容,2022/10/9131.变量的编码变量的编码要易于识别,2022/11/4,14,变量的编码,变量名 变量标识 变量值 值标识 SEX 性别 1 男 2 女 EDU 教育程度 0 文盲 1 小学 2 初中及以上,2022/10/914变量的编码变量名 变量标识,2022/11/4,15,variable labelsqnum 问卷序号rnum 录入序号pnum 病人编号hnum 住院号/门诊号chname 患者中文姓名drugroup 组别name 患者姓名sex 患者性别age 患者年龄,value labelssex 1 男 2 女/hisc 1 是 0 否 9 无法判断/nsex 1 正常 0 异常 9 未检/demdx 1 有 0 无/addx 0 无 1 危险性 2 可能 3 很可能/edu 0 文盲 1 小学程度 2 初中及以上,2022/10/915variable labelsvalu,2022/11/4,16,2.哑变量的设置和引入,哑变量,又称指示变量或设计矩阵。有利于检验等级变量各个等级间的变化是否相同。一个k分类的分类变量,可以用k-1个哑变量来表示。,2022/10/9162.哑变量的设置和引入哑变量,又称指示,2022/11/4,17,哑变量的设置,教育程度:文盲,小学,初中,高中以上,2022/10/917哑变量的设置教育程度:文盲,小学,初中,2022/11/4,18,以高中作为参照,2022/10/918以高中作为参照,2022/11/4,19,SPSS提供的方法,Indicator: 默认。以第1 或最后1类作对照,其他每类与对照比较;Sample: 以第1 或最后1类作对照,其他每类与对照比较,但反映平均效应。Difference: 除第1类外各分类与其前各类平均效应比较;Helmert: 除最后1类外各分类与其前各类平均效应比较;Repeated: 除第1类外各分类与其前一类比较;Polynomial: 假设类间距相等,用于数值型变量。Deviation: 以第1 或最后1类作对照,其余每类与总效应比较。,2022/10/919SPSS提供的方法Indicator:,2022/11/4,20,3.自变量的单因素分析,了解自变量与因变量的分布检验是否符合建立模型的应用条件偏离应用条件时,进行数据变换各个自变量两组间的比较计数资料计量资料双变量分析,2022/10/9203.自变量的单因素分析了解自变量与因变,2022/11/4,21,4.变量的筛选,变量筛选的原则专业上考虑测量上考虑共线性问题:计算相关矩阵,相关系数0.8-0.9,则选其一。缺失数据少、测量误差低的优先选择经验上考虑双变量分析中有显著性的自变量(P .15)选择那些改变主效应的自变量,2022/10/9214.变量的筛选变量筛选的原则,2022/11/4,22,变量的筛选,变量筛选的可用方法逐步logistic回归:自动选择有显著性的自变量,不仅用于自变量的剔选,也用于交互作用项是否显著的判断。前进法:逐个引入模型外的变量后退法:放入所有变量,再逐个筛选 理论上看,前进法选择变量的经验公式缺乏总体概念,当用于因素分析时,建议用后退法。当变量间有完全相关性时,后退法无法使用,可用前进法。,2022/10/922变量的筛选变量筛选的可用方法,2022/11/4,23,5.交互作用的引入,交互作用的定义当自变量和因变量的关系随第三个变量的变化而改变时,则存在交互作用交互作用项的引入基于临床实际认为对结果有重要影响基于模型应用条件的分析引入两个自变量的乘积项交互作用的检验交互作用的解释,2022/10/9235.交互作用的引入交互作用的定义,2022/11/4,24,6.建立多个模型,饱和模型自定义的模型从饱和模型中选择自变量再建立模型,2022/10/9246.建立多个模型饱和模型,2022/11/4,25,7.选择较优的模型,模型拟合优度检验AIC(Akaike information criterion): 同一资料的多个模型的比较,此值越小,模型越合适。SC(Schwartz criterion):同上Score统计量:同上,但不包括截距项。-2logL(似然比检验,Omnibus Test):检验全部自变量的作用是否显著。较为可靠。适用于含连续性变量的情况。模型拟合好, x2值大,P值小。Hosmer-Lemeshow检验:评价估计概率和观察概率接近的程度。适用于含连续性变量的情况。模型好, x2值小,P值大。,2022/10/9257.选择较优的模型模型拟合优度检验,2022/11/4,26,8.模型应用条件的评价,残差分析残差是观察值与估计值之差合理的logistic回归模型也可能得到不理想的残差,这在自变量是二分类变量时更易出现。增加交互作用项可能增加模型的效能,2022/10/9268.模型应用条件的评价残差分析,2022/11/4,27,9.输出结果的解释,模型中各个系数的显著性检验Wald检验:类似于直线回归系数的t检验Wald x2检验:同上似然比检验:自变量不在模型中与在模型中的似然值比较。Score检验,2022/10/9279.输出结果的解释模型中各个系数的显著,2022/11/4,28,输出结果的解释,回归系数的解释系数的正负值:正(负)系数表示随自变量的增加因变量logit值的增加(减少)。二分类自变量 系数为比数比的对数值,由此比数比=eb多分类自变量 以第i类作参照,比较相邻或相隔的两个类别。连续型自变量 当自变量改变一个单位时,比数比为eb,2022/10/928输出结果的解释回归系数的解释,2022/11/4,29,输出结果的解释,模型拟合的优劣自变量与结果变量(因变量)有无关系确认因变量与自变量的编码模型包含的各个自变量的临床意义由模型回归系数计算得到的各个自变量的比数比的临床意义,2022/10/929输出结果的解释模型拟合的优劣,2022/11/4,30,输出结果的解释,模型的预测结果的评价敏感度、特异度和阳性预测值 正确选择预测概率界值,简单地以0.5为界值,但并不是最好的。C指数 预测结果与观察结果的一致性的度量。C值越大(最大为1),模型预测结果的能力越强。,2022/10/930输出结果的解释模型的预测结果的评价,2022/11/4,31,非条件logistic回归,研究对象之间是否发生某事件是独立的。适用于:成组的病例-对照研究无分层的队列研究或横断面调查诊断性试验,2022/10/931非条件logistic回归研究对象之间,2022/11/4,32,条件logistic回归,研究中有N个配比组,每组中n个病例配m个对照者。这时,各个研究对象发生某事件的概率即为条件概率。适用于配比设计的病例-对照研究精细分层设计的队列研究,2022/10/932条件logistic回归研究中有N个配,2022/11/4,33,logistic回归的应用,疾病影响因素的研究校正混杂因素疾病预后的估计疾病诊断,2022/10/933logistic回归的应用疾病影响因素,2022/11/4,34,疾病影响因素的研究,病因学研究病例-对照研究队列研究影响因素的研究横断面调查临床试验,2022/10/934疾病影响因素的研究病因学研究,2022/11/4,35,校正混杂因素,一般采用Mantel-Haenszel分层分析分层较细或存在格子零频数时,M-H法无法采用。logistic回归分析可综合校正多个混杂因素的影响,2022/10/935校正混杂因素一般采用Mantel-Ha,2022/11/4,36,疾病预后的估计,logistic回归模型作为一种概率模型,可用于预测某事件发生的概率。logistic回归不要求在因变量正态假设的前提下进行预测。,2022/10/936疾病预后的估计logistic回归模型,2022/11/4,37,疾病诊断,疾病诊断的判别诊断性试验研究中,敏感度和特异度的估计logistic回归模型综合校正协变量的影响充分利用数据提供的信息可进行95%可信区间的估计,2022/10/937疾病诊断疾病诊断的判别,2022/11/4,38,logistic回归的其他问题,多分类logistic回归模型因变量为二分类变量因变量为多分类变量 多分类logistic回归,2022/10/938logistic回归的其他问题多分类l,2022/11/4,39,其他问题,研究对象例数的确定研究设计时样本含量的估计经验方法:模型中的每一自变量至少需要出现10个结局。给定例数时自变量太多删除变量合并变量及变量的分类,2022/10/939其他问题研究对象例数的确定,2022/11/4,40,其他问题,logistic回归的局限性理论上的不足:自变量对疾病的影响是独立的,但实际情况及推导结果不同。模型有不合理性:“乘法模型”与一般希望的“相加模型”相矛盾。最大似然法估计参数的局限样本含量不宜太少:例数大于200例时才可不考虑参数估计的偏性。,2022/10/940其他问题logistic回归的局限性,

    注意事项

    本文(Logistic回归分析及其应用课件.ppt)为本站会员(小飞机)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开