欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    统计17章生存分析.ppt

    • 资源ID:6152132       资源大小:329.50KB        全文页数:77页
    • 资源格式: PPT        下载积分:15金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要15金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    统计17章生存分析.ppt

    1,第十七章 生存分析Survival Analysis,授课老师:曾小敏公共卫生学院 卫生统计学教研室,2,(结果信息和时间信息),3,4,第一节 生存分析中的基本概念第二节 生存率的估计与生存曲线第三节 生存曲线的log-rank检验第四节 Cox比例风险回归模型第五节 寿命表,生存分析:将事物发生的结果和随访时间两个因素结合在一起进行分析的一种统计学方法。能充分利用得到的研究信息,更加准确地评价和比较随访资料。,5,第一节 生存分析中的基本概念一、基本概念1生存时间(survival time)2失效事件(failure event)与起始事件(initial event)3截尾值(censored value)4生存率与风险函数(1)生存函数(survival function):又称为累积生存率,简称生存率。(2)风险函数(hazard function)5死亡概率与死亡密度函数(1)死亡概率(2)死亡密度函数,6,1生存时间:生存时间(survival time)是任何两个有联系事件之间的时间间隔,常用符号 t 表示。狭义的生存时间患某种疾病的病人从发病死亡所经历的时间跨度 广义的生存时间从某种起始事件终点事件所经历的时间跨度(如:戒烟)。明确:事件的起点、终点、时间的测度单位(小时、日、月、年等)2失效事件与起始事件:失效事件(failure event)反映治疗效果特征的事件,又称为死亡事件、终点事件。它是根据研究目的确定,因此在设计时必须明确规定,并在研究中严格遵守。起始事件(initial event)反映生存时间起始特征的事件,如疾病确诊、某种疾病治疗开始、接触毒物等,设计时也需要明确规定。,7,3截尾值:指在随访过程中,由于某种原因未能观察到病人的明确结局(即终止事件),所以不知道该病人的确切生存时间,它提供的生存时间的信息是不完全的。提示:真实的生存时间只能长于观察到的时间而不会短于这个时间。产生截尾值的原因:病人失访。病人的生存期超过了研究的终止期。在动物实验中,有时事先规定观察期限或动物数,虽然有一部分动物在到达实验终止日期时尚未出现规定的终止事件,但仍停止实验,或者当达到了事先规定的终止事件的动物数后实验停止。,8,影响生存时间的因素,9,10,二、资料收集(一)随访内容 1确定开始随访的时间:入院时间、确诊时间、开始治疗时间等。2随访的结局和终止随访的时间:随访的结局可能有以下几种:“死亡”,即处理失效,终止时间即为“死亡”时间;生存但中途失访,包括拒绝访问、失去联系或中途退出试验,其终止 时间以最后一次访问时间为准;死于其他与研究疾病无关的原因,如肺癌患者死于心肌梗死、自杀或车祸等,其终止随访的时间为死亡时间;随访截止,随访研究结束时观察对象仍存活,终止随访时间为研究结束时间。3记录影响生存时间的有关因素:如患者的年龄、病程、术前健康状况、经济、文化、职业等,以便分析这些因素对生存时间的影响。,11,(二)随访方式1全体观察对象同时接受处理措施,观察到最后一例出现结果,或者事先规定的随访截止时间,如图17-1a。图中“”表示“死亡”,“o”表示失访、退出研究或死于与本研究无关的其他原因。,12,2全体观察对象在不同时间接受治疗处理,完成一定数量随访病例后决定随访截止时间,或按事先规定的时间停止随访,这是临床试验最常见的形式,如图17-1b。如病人在不同时间接受心脏移植手术,有的病人可能术后20年仍然存活,而随访难以持续那么长的时间,可根据不同的研究内容,按设计时的要求观察到预定时间,如3年或5年截止随访。,13,(三)生存分析研究的主要内容1描述生存过程:研究生存时间的分布特点,估计生存率及平均存活时间,绘制生存曲线等。根据生存时间的长短,可以估计出各时点的生存率,并根据生存率来估计中位生存时间,同时也可根据生存曲线分析其生存特点。2比较生存过程:通过生存率及其标准误对各样本的生存率进行比较,以探讨各总体的生存过程是否有差别。例如比较手术治疗和化学治疗乳腺癌患者的生存率,以探讨何种治疗方案效果较好。3分析影响生存时间的因素:重点是通过生存分析模型来探讨影响生存时间的因素,通常以生存时间和结局作为应变量而将影响他们的因素作为自变量,比如年龄、性别、病理分型、治疗方式等。通过拟合生存分析模型,筛选影响生存时间的保护因素和有害因素。4.预测,14,三、生存分析的基本方法1非参数法 特点:不论资料是什么样的分布形式,只根据样本提供的顺序统计量对生存率进行估计 常用的方法:乘积极限法(又称Kaplan-Meier法,有精确生存时间的大小样本资料))和寿命表法(大样本)。对于两个及多个生存率的比较,其无效假设(H0)只是假定两组或多组总体生存时间分布(生存过程)相同,而不对其具体的分布形式及参数进行推断(推断的方法:log-rank检验(对远期差异敏感)、Breslow检验又称Wilcoxon检验(对近期差异敏感))。2参数法 特点:假定生存时间服从于特定参数的分布,然后根据已知分布的特点对影响生存时间进行分析 常用的方法:指数分布法、Weibull分布法、对数正态回归分析法和对数logistic回归分析法等。参数法通过估计的参数得到生存率的估计值。对于两组及以上的样本,可根据参数估计对其进行统计推断。3.半参数法 半参数法兼有参数法和非参数法的特点,主要用于分析影响生存时间和生存率的因素,属多因素分析方法,其典型方法是Cox模型分析法。,15,生存分析的结果报告:一、生存率估计:报告估计方法、生存曲线、中位生存时间。二、生存曲线比较:报告生存曲线、生存曲线比较方法、检验统计量及P 值。三、影响因素分析:报告变量筛选方法、检验水准a、各变量RR、RR95%可信区间及P 值。,16,第二节 生存率的估计与生存曲线 一、小样本资料生存率及其标准误的计算 二、大样本资料的生存分析,17,一、小样本资料的分析 生存率及其标准误的计算1计算生存率2计算生存率的标准误3生存曲线 4中位生存时间,18,19,20,1生存率的计算:采用乘积极限法(product-limited method),该法由Kaplan-Meier于1958年提出,故又称为Kaplan-Meier法。它利用条件概率及概率乘法的原理来计算生存率。,21,22,注意:对于具有截尾数据的条件死亡率为0,而其条件生存率必为1,其对应的生存率必然与前一个非截尾值的生存率相同。,23,2生存率的标准误的计算,24,总体生存率的可信区间的估计:,不适合于曲线尾部或接近尾部总体生存率的可信区间估计。,此时正态性较差,所估计的可信区间的上、下限值可能小于0或大于1。此时可以计算生存率经对数变换后的值以及相应的标准误,据此来估计其可信区间。,25,26,27,3生存曲线 以生存时间为横轴、生存率为纵轴绘制一条生存曲线(survival curve),用以描述其生存过程。并根据两条生存曲线的高低,直观的比较不同治疗方式之间的生存过程。,28,例17-2 假定用乙种手术方式治疗了与上例病情一致的肾上腺肿瘤病人20例,其生存时间和死亡情况为1(2),2,3(2),4(3),6(2),8,9(2),10,11,12,13,15,17,18,括号内为死亡人数,用例17-1相同的方法计算的生存率及其标准误见表17-2。,29,30,根据表17-1和表17-2计算的生存率,绘制的生存曲线见图17-2。,31,乘积极限法只估计生存时间上的生存率及其标准误,故其对应的生存 曲线是阶梯曲线。从图中可以看出,乙种手术方式生存曲线较低,说明其生存率较低,而甲种手术方式的生存曲线较高,说明其生存率较高,这种生存曲线又称为K-M(Kaplan-Meier)曲线。,32,4中位生存时间(median survival time):又称为生存时间的中位数,表示刚好有50%的个体其存活期大于该时间。它是生存分析中最常用的概括性统计量。,计算方法两种:(1)图解法:利用生存曲线图(见图17-2),从纵轴生存率为0.5处划一条对横轴的平行线与生存率曲线相交,然后自交点划垂线与横轴相交,此交点即为中位生存时间。简单直观,但其结果较粗略,在例数较少时,结果的误差较大。,33,根据同样的原理可以计算出不同百分位数的生存时间。(试计算生存率为40%的生存时间),34,二、大样本资料的生存分析1生存率的计算 2生存率曲线 样本较大时,随访病例的生存时间常可按年、月或日进行分组,得到具有若干时间段生存数据的频数表。对于分组的生存数据可按寿命表(life table)法计算生存率,其基本原理是首先求出患者在治疗后各时期的生存概率,然后根据概率的乘法原理,将各时期生存概率相乘,即得到从开始观察到各个时点的生存率。并对生存率或生存分布之间的差别进行假设检验。,35,例17-3 某研究者收集了男性心绞痛患者2418例,经随访将有关资料整理后列于表17-3,其中生存时间是以年计算的,试计算其生存率及其标准误。,36,37,1生存率的计算 将生存资料以经历时间的长短分成若干时间区间,死亡和截尾的例数分别列入各时间区间内,并整理成表格的形式后计算生存率。,38,39,计算结果见表17-3第(9)栏。,40,2生存率曲线 分别将样本不同时点(时间区间的中点)的生存率绘在方格坐标纸上,以直线相连即得到生存率曲线图,不同样本间的生存率可进行直观的分析比较。图17-3是根据表17-3中生存时间及生存率所绘制的生存率曲线。同样可以采用图解法和线性内插法计算其中位生存时间。其方法与小样本资料相同。,图17-3 男性心绞痛病人的生存曲线,41,第三节 生存曲线的log-rank检验,log-rank检验的基本思想:实际死亡数与期望死亡数之间的比较。它是对各组生存率作整体的比较,故应用范围较广。它适用于两组及多组生存率之间的比较。这里只介绍两组生存率之间的比较方法。(非参数法),42,例17-4 据用例17-1和例17-2的资料,问甲种手术方式后和乙种手术方式后病人的生存率有无差别?,43,44,45,46,47,48,应用条件:log-rank检验对样本的生存率进行比较时,要求各组生存曲线不能交叉。当生存曲线有交叉提示存在某种混杂因素,此时应采用分层的办法或多因素的办法来校正混杂因素。另外,当假设检验推断有差别时,可以通过生存曲线、半数生存期及相对危险度等指标来评价不同的临床处理方法的效果。,49,第四节 Cox比例风险回归模型,主要用于研究影响生存时间和生存率的因素(协变量X)与观察结果之间的关系。特别针对临床医学随访资料具有的特殊性:生存时间的分布种类繁多且难以确定、存在截尾数据、需要考虑多个协变量的影响等,1972年英国统计学家Cox提出了比例风险回归模型(proportional hazard regression model),简称Cox模型。,50,P372:例17-5 为探讨某恶性肿瘤的预后,收集了63例病人的生存时间、结局及影响因素。影响因素包括病人的治疗方式、肿瘤的浸润程度、组织学类型、是否有淋巴结转移及病人的性别、年龄,生存时间以月计算,变量的赋值和收集的原始资料见表17-5和表17-6。试用Cox模型进行分析。,51,1,0,52,*存在截尾数据(Y=1)*存在多个协变量的影响,53,生存分析的主要目的:研究协变量(X)与观察结果即生存函数(P355,生存率)之间的关系。当生存率()受到协变量的影响时,传统的方法是考虑回归分析,即各协变量对 的影响。但是:生存分析研究的数据中包含有截尾数据,用一般的方法难以解决上述问题。Cox模型分析,54,一、Cox模型的基本形式,Cox模型:不直接考察生存函数与协变量的关系。以风险率函数 作为应变量,并假定:,前提:变量间无交互作用,55,56,二、Cox模型的参数估计与假设检验,(一)Cox模型的参数估计方法:采用偏似然函数(Partial likelihood function)估计,57,(二)Cox模型的假设检验(有三种方法,类似于logistic回归分析的),58,59,三、参数的意义及其解释1、回归系数与相对危险度,60,61,62,(针对单个变量),63,2.,64,65,66,67,四、因素的初步筛选与最佳模型的建立,单因素分析:,68,69,70,1,0,71,*存在截尾数据(Y=1)*存在多个协变量的影响,72,73,74,六、所学三种回归模型的比较,相同点:1)自变量可以是连续变量、有序或无序分类变量(哑变量处理);2)当有相关关系的自变量存在时导致共线性现象;3)当自变量之间有交互作用时,要考虑交互作用项;4)都可以进行变量筛选。先考虑单变量分析,后做多元分析;5)都可以进行影响因素分析、混杂因素校正、预测等。,75,76,第五节 寿命表(life table)又称生命表,是根据某一人群的年龄别死亡率计算出来的一种统计表。其中有一系列指标:等,都可以用来评价居民健康状况。根据编制目的和资料来源不同,可分为:现时寿命表(current life table)用于分析横断面资料,属于死亡统计范畴。队列寿命表(cohort life table):用于队列资料的分析。,77,第十七章 生存分析Survival Analysis授课老师:曾小敏公共卫生学院 卫生统计学教研室,谢谢!,

    注意事项

    本文(统计17章生存分析.ppt)为本站会员(牧羊曲112)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开