生存分析SurvivalAnaly.ppt
《生存分析SurvivalAnaly.ppt》由会员分享,可在线阅读,更多相关《生存分析SurvivalAnaly.ppt(59页珍藏版)》请在三一办公上搜索。
1、生存分析Survival Analysis,To be or not to be is only a part of the question.The question also includes how long to be.,生存分析(survival analysis)是将事件的结果(终点事件)和出现这一结果所经历的时间结合起来分析的一种统计分析方法。生存分析不同于其它多因素分析的主要区别点就是生存分析考虑了每个观测出现某一结局的时间长短。,前 言,第一节 生存分析基本概念,一、生存时间(survival time,failure time)终点事件与起始事件之间的时间间隔。终点事件指研
2、究者所关心的特定结局。起始事件是反映研究对象生存过程的起 始特征的事件。,生存时间举例,起始事件 终点事件 服药 痊愈 手术切除 死亡 染毒 死亡 化疗 缓解 缓解 复发,终点事件和起始事件是相对而言的,它们都由研究目的决定,须在设计时明确规定,并在研究期间严格遵守,不能随意改变。,生存时间的类型,1.完全数据(complete data)从起点至死亡(死于所研究疾病)所经历的时间。2.截尾数据(删失数据,censored data)从起点至截尾点所经历的时间。截尾原因:失访、死于其它疾病、观察结束时病人尚存活等。,例如,某肿瘤医院调查了1991-1995年间经手术治疗的大肠癌患者150例,对
3、可能影响大肠癌术后生存时间的因素进行了调查,如性别、年龄、组织学分类、肿瘤大小、DureS分期等。随访截止日期为2000年12月30日,随访记录见下表。,大肠癌患者的随访记录 编号 性别 年龄 手术日期 随访终止日期 随访结局 生存时间(天)1 男 45 1991.05.20 1995.06.04 死亡 1476 2 男 50 1992.01.12 1998.08.25 死亡 2417 3 女 36 1991.10.24 1994.03.18 失访 876+4 男 52 1994.11.02 2000.12.30 存活 2250+5 女 56 1994.06.25 1995.03.17 死亡
4、265 6 女 60 1993.12.05 1996.08.16 死于其它 985+,生存时间,生存时间的度量单位可以是年、月、日、小时等。常用符号t表示,截尾数据在其右上角标记“+”。生存资料的主要特点:含有截尾数据。截尾数据的特点:真实的生存时间未知,只知道比观察到的截尾生存时间要长。生存时间的分布一般不呈正态分布。,二、条件生存概率、生存率、生存曲线,条件生存概率:(conditional probability of survival)表示某单位时段开始时存活的个体,到该时段结束时仍存活的可能性。年条件生存概率表示年初尚存人口存活满1年的可能性。,生存率:(survival rate,
5、survival function)指观察对象经历t个单位时段后仍存活的可能性。,条件生存概率和生存率的计算,例:手术治疗100例食管癌患者,术后1、2、3年的死亡数分别为10、20、30,若无截尾数据,试求各年条件生存概率及逐年生存率。生存率计算方法:直接法概率乘法定理,由例子可看出,生存率与条件生存概率不同。条件生存概率是单个时段的结果,而生存率实质上是累积条件生存概率(cumulative probability of survival),是多个时段的累积结果。例如,3年生存率是第1年存活,第2年也存活,第3年还存活的可能性。,生存曲线(survival curve)以观察(随访)时间为
6、横轴,以生存率为纵轴,将各个时间点所对应的生存率连接在一起的曲线图。生存曲线是一条下降的曲线,分析时应注意曲线的高度和下降的坡度。平缓的生存曲线表示高生存率或较长生存期,陡峭的生存曲线表示低生存率或较短生存期。,某医师收集20例脑瘤患者甲、乙两疗法治疗的生存时间(周)如下:甲疗法组 1 3 3 7 10 15 15 23 30乙疗法组 5 7+13 13 23 30 30+38 42 42 45+,三、中位生存期,中位生存期(median survival time)又称半数生存期,表示恰好有50的个体尚存活的时间。中位生存期越长,表示疾病的预后越好;中位生存期越短,预后越差。估计中位生存期常
7、用图解法或线性内插法。,生存资料统计学处理方法,(一)设计目的:专业目的:据专业知识确定。统计学目的:估计:根据样本生存资料估计总体生存率及其它有关指标(如中位生存期等),如根据脑瘤患者治疗后的生存时间资料,估计不同时间的生存率、生存曲线以及中位生存期等。比较:对不同处理组生存率进行比较,如比较不同疗法治疗脑瘤的生存率,以了解哪种治疗方案较优。,影响因素分析:目的是为了探索和了解影响生存时间长短的因素,或平衡某些因素影响后,研究某个或某些因素对生存率的影响。如为改善脑瘤病人的预后,应了解影响病人预后的主要因素,包括病人的年龄、性别、病程、肿瘤分期、治疗方案等。预测:具有不同因素水平的个体生存预
8、测,如根据脑瘤病人的年龄、性别、病程、肿瘤分期、治疗方案等预测该病人t年(月)生存率。,方法:前瞻性队列研究 回顾性队列研究确定起始事件、终点事件、随访终止日期、生存时间、截尾。确定可能的影响因素、水平以及量化方法。,大肠癌影响因素量化表,变量名 因素 量化值 病例数 构成比(%)X1 性别 女=0 32 48.5 男=1 34 51.5 X2 年龄(岁)40=1 10 15.1 40-60=2 37 56.1 60=3 19 28.8 X3 组织学分类 乳头状腺癌=0 20 30.3 管状腺癌=1 46 69.7 X4 肿瘤大小(cm)6=0 29 43.9 6=1 37 56.1,X5 细
9、胞增殖抗原(PCNA)55%=0 27 40.9 55%=1 39 59.1 X6 淋巴管浸润 无=0 44 66.7 有=1 22 33.3 X7 血管浸润 无=0 58 87.9 有=1 8 12.1Time 手术到观察结束 实际天数Event 结束时是否死亡 未死=0 22 33.3 死亡=1 44 66.7,设计调查表:一览表:因素较少时。单一表:因素较多时。调查表中应包括可能的影响因素观察起点和终点(年、月、日)生存时间生存结局样本含量:非截尾例数至少是可能影响因素的10倍。,三联体数据,(二)搜集资料可能的影响因素:从病历获得。生存时间及结局:短期可观察到的结局可从病历获得;长期结
10、局一般不能从病历直接获得,通过信访、电话等得到。,(三)整理资料认真检查、核对原始数据,包括影响因素、生存时间和生存结局。尽量避免缺失值。建立数据库FoxBase、Foxpro、Virual Foxpro等专业数据库统计软件数据库(SAS、SPSS等)Office办公软件中的Excel、Access,大肠癌生存资料序号 X1 X2 X3 X4 X5 X6 X7 Time Event 1 0 2 1 0 0 1 0 2896 0 2 0 2 1 0 0 1 0 992 1 3 1 2 1 1 0 0 0 2811 0 4 0 3 1 1 0 1 0 2052 1 5 1 2 0 1 0 0 0
11、2975 0 6 1 2 1 1 1 1 1 856 1 65 0 1 1 1 1 0 0 584 1,生存资料基本要求,样本由随机抽样方法获得,要有一定的数量。死亡例数不能太少。截尾比例不能太大。生存时间尽可能准确。因为常用的生存分析方法都在生存时间排序的基础上作统计处理,即使是小小的舍入误差,也可能改变生存时间顺序而影响结果。缺项应尽量补齐。,(四)分析资料估计:Kaplan-Meier法,寿命表法比较:log-rank检验影响因素分析:Cox比例风险回归模型(Cox回归模型),是生存分析中最重要的模型之一。预测:Cox回归模型预测生存率。,第二节 生存率的估计与生存曲线,一、小样本资料生
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生存 分析 SurvivalAnaly
链接地址:https://www.31ppt.com/p-6315681.html