艾滋病疗法的评价及疗效的预测高教社杯全国大学生数学建模竞赛.doc
《艾滋病疗法的评价及疗效的预测高教社杯全国大学生数学建模竞赛.doc》由会员分享,可在线阅读,更多相关《艾滋病疗法的评价及疗效的预测高教社杯全国大学生数学建模竞赛.doc(19页珍藏版)》请在三一办公上搜索。
1、艾滋病疗法的评价及疗效的预测摘要艾滋病是当前人类社会最严重的瘟疫之一,它的传染能力强、致命性极高,从而对人类造成很大的威胁。为能尽早征服艾滋病,对医疗机构所做的试验性疗法作出合理的评价和预测就十分重要。本文针对提出的问题,分别就疗效预测和不同疗法的评价建立模型并求解。问题1:根据问题的要求和数据特点,需要分三步建模和求解:第一步,利用聚类分析。将问题中附件1的数据按初始检测值(包括CD4和HIV)和治疗中期疗效进行两次聚类,共分为11类。第二步,用Lagrange插值法对每类中的数据进行扩展,形成较连续的数据列。第三步,对形成的数据列用多项式函数拟和预测继续治疗的效果或者确定最佳治疗终止时间。
2、以聚类结果中第七类为例,得出结论:最佳治疗终止时间大致应为第38周。问题2:将其求解过程分为两部分。第一部分,不同疗法优劣的评价。考虑方差分析对样本观测值要求较高,故此处选用非参数检验中的两种处理方法比较的Wilcoxon检验和多种处理方法比较的Kruskal-Wallis检验。得到的结果是:在青年组和中年组中疗法4疗效显著,其次是疗法 3 。第二部分,疗效预测。选用青年组的数据作为主要分析对象。对数据按疗法分为4类,再将每类中不同患者的检测数据按每个患者取最大值筛选出来。在筛选出的数据中对时间列求均值,得到的均值即为该疗法最佳治疗终止时间。得出结论:选取疗法四做研究对象,可得最佳治疗终止时间
3、为20.2359周。问题3:大体上预测方法和问题二相同,主要是在评价问题上,我们要对花费资金和疗效进行权衡,各个疗法的疗效我们用问题二中求出的秩和均值来表示,然后赋上权重,就可以得到一个指标,结果为疗法三,其在中年组中的最佳治疗终止时间约是12.37周,较原来的18.55周减少了约六周。关键字:聚类分析 Lagrange插值 Wilcoxon检验 Kruskal-Wallis检验一问题重述艾滋病是当前人类社会最严重的瘟疫之一,从1981年发现以来的20多年间,它已经吞噬了近3000万人的生命。艾滋病的医学全名为“获得性免疫缺损综合症”,英文简称AIDS,它是由艾滋病毒(医学全名为“人体免疫缺损
4、病毒”, 英文简称HIV)引起的。这种病毒破坏人的免疫系统,使人体丧失抵抗各种疾病的能力,从而严重危害人的生命。人类免疫系统的CD4细胞在抵御HIV的入侵中起着重要作用,当CD4被HIV感染而裂解时,其数量会急剧减少,HIV将迅速增加,导致AIDS发作。 艾滋病治疗的目的,是尽量减少人体内HIV的数量,同时产生更多的CD4,至少要有效地降低CD4减少的速度,以提高人体免疫能力。迄今为止人类还没有找到能根治AIDS的疗法,目前的一些AIDS疗法不仅对人体有副作用,而且成本也很高。许多国家和医疗组织都在积极试验、寻找更好的AIDS疗法。现在得到了美国艾滋病医疗试验机构ACTG公布的两组数据。 AC
5、TG320(见附件1)是同时服用zidovudine(齐多夫定),lamivudine(拉美夫定)和indinavir(茚地那韦)3种药物的300多名病人每隔几周测试的CD4和HIV的浓度(每毫升血液里的数量)。193A(见附件2)是将1300多名病人随机地分为4组,每组按下述4种疗法中的一种服药,大约每隔8周测试的CD4浓度(这组数据缺HIV浓度,它的测试成本很高)。4种疗法的日用药分别为:600mg zidovudine或400mg didanosine(去羟基苷),这两种药按月轮换使用;600 mg zidovudine加2.25 mg zalcitabine(扎西他滨);600 mg
6、zidovudine加400 mg didanosine;600 mg zidovudine加400 mg didanosine,再加400 mg nevirapine(奈韦拉平)。请你完成以下问题:(1)利用附件1的数据,预测继续治疗的效果,或者确定最佳治疗终止时间(继续治疗指在测试终止后继续服药,如果认为继续服药效果不好,则可选择提前终止治疗)。(2)利用附件2的数据,评价4种疗法的优劣(仅以CD4为标准),并对较优的疗法预测继续治疗的效果,或者确定最佳治疗终止时间。(3)艾滋病药品的主要供给商对不发达国家提供的药品价格如下:600mg zidovudine 1.60美元,400mg di
7、danosine 0.85美元,2.25 mg zalcitabine 1.85美元,400 mg nevirapine 1.20美元。如果病人需要考虑4种疗法的费用,对(2)中的评价和预测(或者提前终止)有什么改变。二符号说明:表示原假设:表示备则假设 N:表示接受四种试验性疗法治疗的总人数 :表示接受第i种疗法的人数,满足:表示在各组的样本观测值中取第i个最小观测值的个体数目 :表示各组的秩和 K:表示Kruskal-Wallis统计量 :表示每组中各个个体的秩:表示每组中个体秩的和,即:表示的观测值三问题分析艾滋病是当前人类社会最严重的瘟疫之一,它的传染能力强、致命性高,并且迄今为止还没
8、有找到能根治AIDS的疗法。目前的一些疗法不仅对人体有副作用,且成本也很高。许多国家和医疗组织都在积极试验、寻找更好的AIDS疗法。因此,对已有的试验性疗法的疗效做出合理评价以及疗效预测势在必行。此题的三个具体问题就试验性疗法的疗效进行了不同角度的研究。其中(1)题针对不同病人采用同样疗法的疗效进行预测或确定其最佳治疗终止时间。而(2)题是从对比的角度对不同疗法的优劣做评价,在此基础上对较优的疗法预测继续治疗的效果或者确定最佳治疗终止时间。(3)题与实际情况紧密相关,考虑到不发达国家的经济状况,加入了不同疗法治疗的成本,再来讨论(2)中所提出的问题。由于问题(1)、(2)、(3)研究所用到的数
9、据不相关,因此在建模和求解时应把它们分成两个整体,即问题(1)为一个整体,问题(2)和(3)为一个整体。四、基本假设 1论文中用到的时间均以周为单位。 2针对不同病人所采集的数据相互独立,即认为不同病人的染病和治疗过程 相互独立。 3对只有一次检测数据的病人,认为他未接受试验性疗法的治疗或者治疗过 程中疗效不显著。 4检测指标(包括CD4和HIV)的数值在两次检测时间间隔内不会出现突变 或巨变。 五模型的建立与求解5.1 问题(1)的模型5.1.1模型分析及合理假设根据问题(1)的要求和数据特点,需要分三步进行求解:第一步,利用聚类分析。将问题中附件1的数据按初始检测值(包括CD4和HIV)和
10、治疗中期的疗效进行两次聚类,共分为11类。第二步,对每类中的数据进行扩展,形成较连续、时间间隔较均匀的数据列。第三步,在此基础上用函数拟和预测继续治疗的效果或者确定最佳治疗终止时间。 以上过程的进行是基于两个合理假设:1)预测继续治疗的效果或者确定最佳治疗终止时间针对的是聚类后的每一类病人。2)进行数据扩展时需将该类病人看作基本相同。5.1.2聚类分析1由于对指标CD4和HIV检测时所涉及到的300多名病人身体状况和抵抗力各不相同,所以在预测继续治疗的效果或者确定最佳治疗终止时间时不能笼统而言。进行聚类时,根据数据特点进行两次聚类:第一次聚类选取的指标为各个病人初始CD4和HIV的检测值。之后
11、对聚类结果中各类做第二次聚类。选用的指标是各个病人在治疗中期的CD4和HIV检测值。考虑到每个病人的检测时间间隔不一致,且数据存在缺失,故我们选取第8周的检测数据作为治疗中期的检测值。但是,一些病人在第8周并未进行检测,故对这类病人的检测数据运用Lagrange插值法25 可得到第8周的数据。进行聚类之后,就可以将病人按照上述标准分开,这不仅有利于预测继续治疗的效果,还有利于医疗机构将就诊病人归类,以便对其采用有效的治疗方案。利用SPSS软件3进行聚类的最终结果详见附件一。5.1.3数据的扩展进行数据扩展,就是利用现有数据尽可能增加可用于预测的数据。根据检测数据变量少、单个病人检测次数少的特点
12、,会发现如果直接采用传统的预测模型(如回归预测、函数拟和灰色系统等)做分析预测,不可避免出现较大误差。所以,对已有的检测数据进行扩展十分必要。具体做法是:将上一步聚类结果中的每类病人视为基本相同的个体,认为治疗过程中同类的各个病人同一时间的检测值相差不大。因此,在每类中对检测CD4的时刻取并集,可得到040周之间较连续的时间点,之后对每个时间点上的CD4浓度分别计算平均值,得到一组随时间变化的CD4浓度均值。HIV的一组浓度均值可仿照CD4得出。以第七类为例,见表1。表1 检测时间034578922CD4浓度均值80.30191.00200.33278.50243.00300.33396.17
13、200.00HIV浓度均值5.393.303.342.952.503.032.251.70检测时间2324252937383940CD4浓度均值289.00273.60144.33236.00762.00248.00270.40216.14HIV浓度均值2.632.512.272.701.703.202.243.20 注:表1中的检测次数为16次,用n表示。每次检测对应的CD4浓度均值用表示,HIV浓度均值用表示。 要预测继续治疗的效果或者确定最佳治疗终止时间,不仅要考察CD4的浓度,还与HIV的浓度有关。因此,需要从这两项指标中提取综合信息。此处采用附权值的方法,即CD4的权值为0.5,HI
14、V的权值也为0.5。得到综合指标表如下:表2检测时间034578922综合指标37.4693.8598.50137.78120.25148.65196.9699.15检测时间2324252937383940综合指标143.19135.5571.03116.65380.15122.40134.08106.47注:上表中数据由下式计算得到:其中和的含义与表1相同。5.1.4疗效预测考虑到此处数据的局限性,时间序列分析和回归预测等方法在此处难以得到较好的效果,故选用多项式函数拟和对各类分别预测继续治疗的效果或者确定最佳治疗终止时间。以第七类为例进行说明。利用Origin软件4对表2的数据进行多项式函
15、数拟合,得到预测图图1和图中一些关键点(如峰值)的坐标,见表3。图1 疗效预测图表3 图1中关键点坐标x轴-4.1-1.51051.0793.66846.25798.847411.4368y轴-196.08219.662486.386393.29288.873893.3234109.029x轴32.152634.742137.331639.921142.510545.1y轴94.4719124.3849156.7169145.63664.777-407.052对图1进行观测可以看出,预测曲线在12周附近达到第一个峰值,在38周附近达到第二个峰值。由于第二个峰值要高出第一个峰值,表明在第一个峰值
16、到第二峰值的治疗期内,同时服用zidovudine(齐多夫定)、lamivudine(拉美夫定)和indinavir(茚地那韦)3种药物的疗法能够达到更好的疗效。同时,预测曲线跃过第二个峰值之后急速下降,这表明在此之后的治疗不但没有使综合指标继续上升,反而起相反的作用。所以对于第七类来说,最佳治疗终止时间大致应为第38周。将此方法推广致其他类别,具体数据见附件二。在得出了各个类别的最佳治疗终止时间后,医疗机构就可以根据这些数据对患者进行针对性治疗。如有感染HIV病毒的患者前来就诊,其初始的HIV和CD4指标和第8周的HIV和CD4指标均可测得。进行判别分析后,把该患者归类,就可以根据他所属类别
17、的治疗特点进行合理和有效的治疗。同时还可就药物的疗效和使用提出建议。因此,对选取的样本进行聚类分析具有很强的合理性以及现实意义。5.2问题(2)的模型5.2.1模型分析及合理假设 基于问题(2)的要求和数据特点,将整个求解过程分为两部分,并分别建立模型求解。第一部分,各疗法优劣的评价。考虑到利用方差分析时各个水平下的样本观测值需满足正态分布或近似正态分布,做正态性检验工作量很大且检验结果难以预料,故此处选用非参数检验中的两种处理方法比较的Wilcoxon检验和多种处理方法比较的Kruskal-Wallis检验。 第二部分,疗效预测。在此问题的求解过程中,所做的合理假设是:在基本假设4的基础上,
18、对只有一次检测数据的病人在提取有效信息时将其置为0。5.2.2疗法的评价1Kruskal-Wallis检验1首先应用多种处理方法比较的KruskalWallis检验对四种疗法进行检验,看各治疗方法的效果是否有显著性差异。要检验的原假设与备则假设分别为: :各治疗方法的效果无显著性差异 vs :各治疗方法的效果有明显差异 由于待观察的指标值中存在结点(在处理效果的度量中,若有两个或两个以上个体的效果度量相同,我们称为有“结点”出现),所以这里选取统计量为:(1)若不真,K有偏大的趋势,因此其拒绝域为:。其中c由式(2)确定。 (2)利用软件Origin7.5和EXCEL做Kruskal-Wall
19、is检验。结果见下表。表4统计量K的值的值是否存在显著性差异青年组47.567.84是中年组12.137.84是老年组4.8157.84否由上表数据可以得出,不同的治疗方法对中青年组的疗效影响显著。对老年人则无显著差异。2Wilcoxon秩和检验1考虑到年龄因素可能会影响对不同疗法的评价,故在做秩和检验之前先将1300多名患者按年龄分组:45岁以下为青年组,45-60岁为中年组,60岁以上为老年组(分组采用国际标准 ),其中青年组人数最多,比较有代表性。由KruskalWallis检验知在青年类(年龄小于45岁)与中年类(年龄大于45且小于60岁)中,四种疗法的疗效存在显著差异,所以接下来用W
20、ilcoxon秩和检验对四种疗法做两两比较。要检验的原假设与备则假设分别为:两种疗法的效果无显著差异 vs :两种疗法的效果有显著差异选取的检验统计量为:当为真时,的期望和方差分别为:(3)(4)若的观测值为,由中心极限定理可知,当m,n充分大时有(5) 利用软件Origin7.5对青年组做秩和检验。 结果见下表。表5 特征值疗法对比的值的值双边检验的p值差异是否显著1与266146.56916828129.70.43250.865否1与367079712801807.80.020.04是1与457785.5696961707.520.010.02是2与368250692821781.980.



- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 艾滋病 疗法 评价 疗效 预测 高教 全国大学生 数学 建模 竞赛

链接地址:https://www.31ppt.com/p-2320337.html