医学统计学第16-章生存分析.ppt
《医学统计学第16-章生存分析.ppt》由会员分享,可在线阅读,更多相关《医学统计学第16-章生存分析.ppt(88页珍藏版)》请在三一办公上搜索。
1、第十六章 随访时间资料的分析,生存分析(survival analysis)是既考虑结局又考虑生存时间的一种分析方法,并可以充分利用不完全数据,对生存时间的分布特征进行统计描述和统计推断,也可以通过多因素模型对影响生存时间的主要影响因素进行分析。通过生存分析方法才能对临床随访资料进行全面和准确的评价。,第一节 生存分析的基本概念 一、基 本 概 念,1、生存时间(survival time)是任何两个有联系事件之间的时间间隔,常用符号t表示。从狭义的角度来讲,生存时间指患某种疾病的病人从发病到死亡所经历的时间。广义的生存时间定义为从某种起始事件到终点事件所经历的时间。,2、失效事件(failu
2、re event),一般是指反映治疗效果特征的事件,又称死亡事件或终点事件。它是根据研究目的所确定,因此在研究设计时必需明确规定,并在研究的实施中严格遵守。起始事件(initial event)是反映生存时间起 始特征的事件 终点事件(死亡事件、失效事件):反映研究 对象生存过程特定结局的事件,完全数据:对研究对象观察到死亡,得到准 确的生存时间不完全数据:对失访、研究结束时仍存活等 研究对象,无法得到准确的生存时间,3、生存资料的类型,截尾的主要原因有三种:,(1)失访:指失去联系;(2)退出:是指退出研究,如死于其它 原因、临时改变治疗方案等;(3)终止:指研究时限已到而终止观 察。,5、
3、生存时间资料的分布特征,生存时间资料常通过随访获得,因观察时间长且难以控制混杂因素,再加上存在截尾数据,规律难以估计,一般为正偏态分布。,6、生存率(survival rate)与 死亡概率,生存率:又叫累积生存率或生存函数。表示观察对象其生存时间T大于t时刻的概率,常用S(t,X)=P(Tt,X)表示。在实际工作中,如无截尾数据,生存率是用生存时间大于t的病人数除以开始观察的病人总数来估计的。,死亡概率:表示观察对象从开始到时间t为止的死亡概率,是一个随时间上升的函数,F(t,X)=P(Tt,X)。死亡概率与生存率的关系是:S(t,X)=P(Tt,X)=1F(t,X)。当 t=0时,死亡概率
4、为0;当观察期为无穷大时,其死亡概率为1。,(条件)死亡概率(Conditional Probability of Failure):是指在某单位时段开始时存活的个体在该时段内死亡的可能性大小。(条件:在某时段的条件下),7、死亡密度函数(death density function),死亡密度函数是死亡概率函数的导数,表示所有观察对象在t时刻的瞬时死亡率。f(t)定义如下:PDF:概率密度函数的估计值,8、风险函数(hazard function),风险函数:生存时间达到t的一群观察对象 在t时刻的瞬时死亡率。,生存函数、风险函数、死亡密度函数的关系:,无截尾数据时,h(t)可估计为:,例1
5、6-1 现有40个肝癌病人的随访资料,见表16-2,试估计生存函数、死亡密度函数和风险函数。(SAS程序见例16-1无截尾程序),data li16_1;input count c time;cards;5 1 0 7 1 5 6 1 10 4 1 15 5 1 20 4 1 25 4 1 30 0 1 35 2 1 40 1 1 45 2 1 50;proc lifetest plots=(s)method=lifewidth=5;time time*c(0);freq count;run;,Life Table Survival Estimates Conditional Effectiv
6、e Conditional Probability Interval Number Number Sample Probability Standard Lower,Upper)Failed Censored Size of Failure Error Survival Failure 0 5 5 0 40.0 0.1250 0.0523 1.0000 0 5 10 7 0 35.0 0.2000 0.0676 0.8750 0.1250 10 15 6 0 28.0 0.2143 0.0775 0.7000 0.3000 15 20 4 0 22.0 0.1818 0.0822 0.5500
7、 0.4500 20 25 5 0 18.0 0.2778 0.1056 0.4500 0.5500 25 30 4 0 13.0 0.3077 0.1280 0.3250 0.6750 30 35 4 0 9.0 0.4444 0.1656 0.2250 0.7750 35 40 0 0 5.0 0 0 0.1250 0.8750 40 45 2 0 5.0 0.4000 0.2191 0.1250 0.8750 45 50 1 0 3.0 0.3333 0.2722 0.0750 0.9250 50.2 0 2.0 1.0000 0 0.0500 0.9500,Survival Media
8、n Median PDF Hazard Interval Standard Residual Standard Standard StandardLower,Upper Error Lifetime Error PDF Error Hazard Error0 5 0 17.5000 3.9528 0.0250 0.0105 0.026667 0.0118995 10 0.0523 15.5000 2.9580 0.0350 0.0120 0.044444 0.01669410 15 0.0725 14.0000 2.6458 0.0300 0.0113 0.048 0.01945415 20
9、0.0787 12.5000 2.9315 0.0200 0.00949 0.04 0.019920 25 0.0787 10.0000 2.6517 0.0250 0.0105 0.064516 0.02847525 30 0.0741 8.1250 2.2535 0.0200 0.00949 0.072727 0.03575830 35 0.0660 11.2500 3.7500 0.0200 0.00949 0.114286 0.05476135 40 0.0523 12.5000 5.5902 0.0.40 45 0.0523 7.5000 5.5902 0.0100 0.00689
10、0.1 0.06846545 50 0.0416.0.00500 0.00494 0.08 0.07838450.0.0345.,二、生存分析研究的主要内容,1、描述生存过程:研究生存时间的分布特点,估计生存率及平均存活时间,绘制生存曲线等。根据生存时间的长短,可以估计出各时点的生存率,并根据生存率来估计中位生存时间。同时也可以根据生存曲线分析其生存特点,2、比较生存过程,可通过生存率及其标准误对各样本的生存率进行比较,以探讨各总体的生存过程是否有差别。,3、影响生存时间的因素分析,通过生存分析模型来探讨影响生存时间的因素,通常以生存时间和结局为应变量,而将影响它们的因素作为自变量,通过拟合生
11、存分析模型,筛选出影响生存时间的保护因素和风险因素,为临床治疗及预防提供重要的参考。,三、生存分析的基本方法1.非参数法:不论资料呈何分布,可根据样本提供的顺序统计量,采用乘积极限法、寿命表法对生存率作估计。对两个及多个生存率的比较,无效假设是“两组或多组总体生存时间分布相同”,不对其具体的分布形式及参数作推断。,2.参数法,假定生存时间服从某种参数分布指数分布法 Weibull分布法对数正态回归分析法对数logistic回归分析法 通过估计分布的参数得到生存率的估计值,两组及多组生存率的比较,对分布的参数进行统计推断。,3.半参数法:,兼有参数法和半参数法的特点对生存时间、生存率作多因素影响
12、分析典型方法 Cox模型,第二节 生存率的估计与生存曲线 一、小样本资料的生存分析例16-2 在儿童急性淋巴细胞白血病(ALL)的生存研究中,有21例高危儿童ALL的临床随访资料。生存时间定义为确诊日期到病人死亡日期的时间跨度,得到的生存时间(月),见表15-3第(1)栏,其中有“”者是截尾数据,表示病人仍生存或失访。试计算其生存率与标准误。,data ex16_2;input month censor;cards;1 0 3 0 4 0 5 0 6 0 8 0 10 0 11 0 12 0 14 0 17 0 18 024 0 30 0 31 0 51 0 62 1 78 1 88 1 11
13、5 1 124 1;proc lifetest plots=(s);time month*censor(1);run;,Survival Standard Number Number month Survival Failure Error Failed Left 0.000 1.0000 0 0 0 21 1.000 0.9524 0.0476 0.0465 1 20 3.000 0.9048 0.0952 0.0641 2 19 4.000 0.8571 0.1429 0.0764 3 18 5.000 0.8095 0.1905 0.0857 4 17 6.000 0.7619 0.23
14、81 0.0929 5 16 8.000 0.7143 0.2857 0.0986 6 15 10.000 0.6667 0.3333 0.1029 7 14 11.000 0.6190 0.3810 0.1060 8 13 12.000 0.5714 0.4286 0.1080 9 12 14.000 0.5238 0.4762 0.1090 10 11 17.000 0.4762 0.5238 0.1090 11 10 18.000 0.4286 0.5714 0.1080 12 9 24.000 0.3810 0.6190 0.1060 13 8 30.000 0.3333 0.6667
15、 0.1029 14 7 31.000 0.2857 0.7143 0.0986 15 6 51.000 0.2381 0.7619 0.0929 16 5 62.000*.16 4 78.000*.16 3 88.000*.16 2 115.000*.16 1 124.000*.16 0,Quartile Estimates Point 95%Confidence Interval Percent Estimate Lower Upper)75 51.000 18.000.50 17.000 10.000 31.000 25 8.000 4.000 14.000,1、生存率的计算,(1)将生
16、存时间由小到大排列:(1)栏。(2)生存时间t对应的死亡人数d:(2)栏。(3)期初观察人数:见n:(3)栏(4)条件死亡率及条件生存率:(4)、(5)栏 F=d/n,S1F(5)活过t时点的生存率:(6)栏 P(Tt)=S,2、生存率的标准误计算,(16-6)表示把小于和等于t时刻的各种非截尾值所对应的 全部加起来。总体生存率的1可信区间:P(T5)=0.810,其总体生存率95CI为,3、生存曲线,以生存时间为横轴、生存率为纵轴绘制一条生存曲线,用以描述其生存过程。并根据两条生存曲线的高低,直观地比较不同病情或不同治疗方式之间的生存过程。例16-3 表16-4第(1)栏为23例标危儿童AL
17、L的临床随访资料。用上例相同方法计算生存率及标准误。,图16-3 标危和高危儿童ALL病人生存曲线的比较,4、中位生存时间,中位生存时间(median survival time)又称为生存时间的中位数,是生存分析中最常用的概括性统计量,表示刚好有50的个体其存活期大于该时间。Median Residual Lifetime:中位剩余寿命(在时刻ti活着的人一半可望生存时间),二、大样本资料的生存分析,对于大样本,按生存时间编制频数表,按寿命表法计算生存率。例16-4 某研究收集了1980-1993年中山市肺癌新发患者2238例,经随访将有关资料整理后列于表16-5,其中生存时间是以月计算的,
18、试计算其生存率及其标准误。,1、生存率的计算 将生存资料以经历时间 的长短分成若干时间区间,死亡和截尾的例 数分别列入各时间区间内。期初观察人数Li:校正观察人数Ni:Ni=Li-ci/2 死亡概率qi:,生存概率pi:pi=1-qi 2、生存率曲线 以不同时点(时间区间的中点)为横坐标,每个时间区间的生存率为纵坐标,得到生存率曲线图(图154)。,图16-4 2238例肺癌病人生存率曲线,data li16_4;input count c time;cards;153.00 1.00 0.00 291.00 1.00 1.00 260.00 1.00 2.00 219.00 1.00 3.0
19、0 164.00 1.00 4.00 121.00 1.00 5.00 111.00 1.00 6.00 61.00 1.00 7.00 63.00 1.00 8.00 47.00 1.00 9.00 32.00 1.00 10.00 27.00 1.00 11.00 18.00 1.00 12.00,17.00 1.00 13.00 19.00 1.00 14.00 5.00 1.00 15.00 15.00 1.00 16.00 10.00 1.00 17.00 15.00 1.00 18.00 4.00 1.00 19.00 10.00 1.00 20.00 4.00.00.00 2.0
20、0.00 1.00.00.00 2.00.00.00 3.00 2.00.00 4.00,3.00.00 5.00 6.00.00 6.00 7.00.00 7.00 9.00.00 8.00 2.00.00 9.00 8.00.00 10.00 4.00.00 11.00.00.00 12.00.00.00 13.00 1.00.00 14.00 1.00.00 15.00 3.00.00 16.00,7.00.00 17.00 3.00.00 18.00 10.00.00 19.00504.00.00 20.00;proc lifetest plots=(s)method=lifewidt
21、h=1;time time*c(0);freq count;run;,Conditional Effective Conditional Probability Interval Number Number Sample Probability Standard Lower,Upper)Failed Censored Size of Failure Error Survival Failure 0 1 153 4 2236.0 0.0684 0.00534 1.0000 0 1 2 291 2 2080.0 0.1399 0.00761 0.9316 0.0684 2 3 260 0 788.
22、0 0.1454 0.00834 0.8012 0.1988 3 4 219 0 1528.0 0.1433 0.00896 0.6847 0.3153 4 5 164 2 1308.0 0.1254 0.00916 0.5866 0.4134 5 6 121 3 1141.5 0.1060 0.00911 0.5130 0.4870 6 7 111 6 1016.0 0.1093 0.00979 0.4587 0.5413 7 8 61 7 898.5 0.0679 0.00839 0.4086 0.5914 8 9 63 9 829.5 0.0759 0.00920 0.3808 0.61
23、92 9 10 47 2 761.0 0.0618 0.00873 0.3519 0.6481 10 11 32 8 709.0 0.0451 0.00780 0.3302 0.6698 11 12 27 4 671.0 0.0402 0.00759 0.3153 0.6847 12 13 18 0 642.0 0.0280 0.00652 0.3026 0.6974 13 14 17 0 624.0 0.0272 0.00652 0.2941 0.7059 14 15 19 1 606.5 0.0313 0.00707 0.2861 0.7139 15 16 5 1 586.5 0.0085
24、3 0.00380 0.2771 0.7229 16 17 15 3 579.5 0.0259 0.00660 0.2748 0.7252 17 18 10 7 559.5 0.0179 0.00560 0.2676 0.7324 18 19 15 3 544.5 0.0275 0.00701 0.2629 0.7371 19 20 4 10 523.0 0.00765 0.00381 0.2556 0.7444 20.10 504 262.0 0.0382 0.0118 0.2537 0.7463,Survival Median Median PDF Hazard Interval Stan
25、dard Residual Standard Standard Standard Lower,Upper)Error Lifetime Error PDF Error Hazard Error 0 1 0 5.2399 0.1944 0.0684 0.00534 0.07085 0.005724 1 2 0.00534 4.8690 0.1878 0.1303 0.00712 0.150426 0.008793 2 3 0.00844 5.2859 0.3416 0.1165 0.00679 0.156815 0.009695 3 4 0.00983 6.4383 0.4030 0.0981
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医学 统计学 16 生存 分析
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-5246420.html