肾炎诊断问题分析 数学建模.docx
《肾炎诊断问题分析 数学建模.docx》由会员分享,可在线阅读,更多相关《肾炎诊断问题分析 数学建模.docx(43页珍藏版)》请在三一办公上搜索。
1、肾炎诊断问题分析摘要本文解决的是如何根据就诊者体内各种元素的含量,判别就诊者是否患有肾炎,并找出影响人们患肾炎的主要因素,以便减少化验的指标,减少检查费用。为解决此问题,我们建立了加权马氏改进模型和模糊模式识别模型来判别就诊者是否患有肾炎,并用神经网络对这两个模型的检验结果进行验证;建立了fisher判别模型找出影响人们患肾炎的主要因素。对于问题一:我们建立了加权马氏距离判别模型和模糊模式识别模型来验证1-60号就诊人员的健康状况,然后与实际情况对比,得出这两种模型的准确度都达到了93.33%.对于问题二:我们用问题一中的两种方法对就诊人员进行判别。用加权马氏判别法得到14人患有肾炎,用模糊模
2、式识别得到11人患有肾炎。两种判别方法都得出:病例号为61,62,64,65,66,67,68,69,72,73,76的就诊人员为肾炎患者,但对病例号为79,83,85的就诊人员判断不一致,用加权马氏判别模型判断,认为79,83,85号为患者,但用模糊模式识别模型判断这三位是健康的。 对于问题三:我们通过fisher判别法得出每种元素对人们患肾炎的影响权重。发现将K,Zn,Fe三种元素剔除后,对结果的检验准确度仍能达到93.3%,将Na剔除以后准确度变为90.0%,所以我们认为Na,Mg,Cu,Ca的含量是影响人们患肾炎的关键因素。对于问题四:我们由第三问得到的结论,把影响人们患肾炎的关键元素
3、作为主要指标,重复问题二的过程,得到的结果是61,62,64,65,66,67,68,69,72,73,76的就诊者为肾炎患者,病例号为79,83,85的就诊人员仍然不能确定。对于问题五:我们将问题二和问题四中的结果进行横向和纵向对比,发现加权马氏改进法和模糊模式识别在剔除了K,Zn,Fe三种元素后,对于待检验的61-90号就诊人员,患肾炎的病号和健康病号没有发生变化,说明我们对影响人们患肾炎的关键因素的判断很准确。关键词:加权马氏距离判别 模糊模式识别 fisher判别 神经网络1问题重述.人们到医院就诊时,通常要检测一些指标来协助医生诊断。我们判断人员是否患肾炎是通过分析人体内各种元素含量
4、来确定的。对于就诊人员说而言不希望自己的病情被误判,所以我们应该确定精确的检测方法。本文我们就如何判断前来就诊人员是否患有肾炎,建立数学模型。有题目所给数据我们可以看出,60位已经诊断的病例号的体内元素含量,其中130号病例是已经确诊为肾炎病人的化验结果;3160号病例是已经确诊为健康人的结果。另外还有61-90号为待检验的就诊患者。需要解决的问题有:问题一:根据表B.1中的数据,提出一种或多种简便的判别方法,判别就诊人员是属于患者或健康人,并检验你提出方法的正确性。问题二:按照1提出的方法,判断表B.2中的30名就诊人员的化验结果进行判别,判定他(她)们是肾炎病人还是健康人。问题三:能否根据
5、表B.1的数据特征,确定哪些指标是影响人们患肾炎的关键或主因素,以便减少化验的指标。问题四:根据3的结果,重复2的工作。问题五:对2和4的结果作进一步的分析。2.问题假设(1)假设题目所给的数据合理正确(2)假设肾炎患者体内各种元素的含量受其他疾病的影响较小;(3)假设医院所用的仪器准确度很高,对各种元素在人体内的含量测得的值很准确;(4)假设用于判断肾炎患者的七种元素,不受人体内其他元素或化合物的影响。3.符号说明A1表示肾炎患者的模糊集合A2表示健康人体的模糊集合A1(xi)表示样本变量xi与A1的隶属度A2(xi)表示样本变量xi与A2的隶属度xii=(1,27)分别代表7种不同元素含量
6、(xi, A1)表示xi与A1的格贴近度(xi, A2)表示xi与A2的格贴近度表示与的内积表示与的外积 样本L1(X,A1)样本X到A1的距离L2(X,A2) 样本X到A2的距离u130个肾炎病人样本各元素的均值向量u230个健康人样本各元素的均值向量y0 Fisher模型中求得的临界值 肾炎患者这类样品的“重心”健康这类样品的“重心” 肾炎患者样本各个元素的均值向量 健康样本各个元素的均值向量4.问题分析此题研究的是如何判断就诊人员是否患有肾炎。在医院就诊时,一般情况下医生是通过就诊人员的尿液的化验结果来判断该就诊人员是否患有肾炎。本题中就是通过分析病人的尿液中各元素的含量来判断的,我们要
7、对这些数据进行分析处理,寻求好的判别方法,判断前来就诊的人员是否患有肾炎。针对问题一,题目中已经给出30个肾炎患者与30个健康者体内7种元素的含量,现在所要做的是,如何根据这些数据提出一种合理的诊断方案。通过分析,我们确定两种比较好的方法来判别病例号是否患有肾炎。方法一:采用改进后的加权马氏距离判别法,即在马氏距离判别法的基础上,对每种不同的指标确定合适的权重从而提高准确度的方法,对实际问题进行判别。方法二:将数据划分为两类,分别用两个集合表示。一类为肾炎患者,一类为健康人体,使用模糊论中的模糊模式识别的方法建立模型,达到判别效果。针对问题二,表B.2中给出了30名就诊人员体内各种元素的含量,
8、我们分别应用问题一中建立的加权马氏判别模型和模糊模式识别模型进行判断,然后将两种判断结果进行比较。得出6190号就诊者的诊断结果。针对问题三,根据表B.1的数据,我们要得到哪些元素是该化验结果的关键指标,即哪些元素在诊断结果中起关键作用。我们重新建立了一个Fisher线性判别模型,求出Fisher系数,按照Fisher模型的理念,依次剔除Fisher系数小的元素,用Fisher判别法对题中给出的160号就诊者进行检验,得出正确率。根据正确率的改变,确定出起关键作用的元素。针对问题四,在问题三中我们已经剔除了对肾炎诊断结果起次要作用的元素,选出在诊断中起关键作用的元素。然后我们再运用问题一的加权
9、马氏改进法和模糊模式识别,对6190号的就诊人员进行判别是否患有肾炎。针对问题五,通过把问题二和问题四中分别运用加权马氏改进法和模糊识别法进行判断的结果进行比较、分析,剔除了次要元素后,61-90号就诊者患肾炎的人员是否发生变化。5.问题一的求解针对问题一,要求我们采用一种或多种方法对前来就诊的人员做初步的判断,我们运用加权马氏判别法(模型一)和模糊识别模型(模型二)寻求了两种判别方法。5.1判别方法一5.1.1模型一的分析对于本题,我们把病人体内含有的7种元素作为化验结果的样本检测的指标,把总体分为肾炎病人类和健康人类。60个人的化验结果是。我们定义为样本到的距离,为样本到样本的距离,通过比
10、较与的大小来判别样品应该归属于类还是类。样品到类和类的马氏距离分别为:其中,,分别为总体和的均值和协方差。在实际问题中,这些指标往往在判断样本属于时,所起的作用不尽相同,其重要性存在差异。因此,马氏距离夸大了一些微小指标的作用。如果不对指标的重要性进行区别,在判定时,可能造成较大的误判,为了减小这种影响,在马氏距离的基础上,我们需要对重要指标加以区分,因此,我们增加了一个权重,构造了加权马氏距离判别法。加权马氏距离判别法的原理:马氏距离判别法是用待判别样本 到各总体的距离远近作为测量尺度来判别其归属的一种直观判别方法。为了提高这种方法对实际问题进行判别时的准确程度,在马氏距离判别法的基础上,对
11、不同的指标加入不同的权重,合理的分配各种指标对问题的影响,这就是加权马氏距离判别法。5.1.2模型一的建立对原始指标数据的标准化 我们采集7维随机向量是题中给出的60个人的化验结果,607,所以我们构造样本阵,对样本进行如下标准化变换:其中,从而可以计算出.求标准化阵的相关系数矩阵加权马氏距离判别法对马氏距离判别法的改进主要取决于权重的选取,权重选取是否得当影响加权马氏距离判别法的准确度。在该实际问题中我们确定权重,其中。我们可以解这个样本相关矩阵的特征方程,得到7个特征根。确定加权的马氏距离根据我们所求得的权重,可以确定加权后的马氏距离为:式中分别是和的均值和协方差。5.1.3确定判别函数在
12、马氏距离判别法中,我们一般通过比较与的大小来判别样品应该归属于类还是类。为了便于对结果进行直观的观察和统计,我们将判别函数定义为与的差值。那么我们确定的判别函数为:=说明样本到类的距离大于到类的距离所以应该属于类即肾炎患者;说明样本到类的距离小于到类的距离所以应该属于类即健康人。5.1.4运用模型一进行检验根据上述建立的加权马氏距离判别法,我们运用matlab软件(代码见附录二)对题目中给出的病例号为160的就诊人员进行检验,检验结果整理如下表(1):表(1):运用加权马氏距离判别法对160号进行检验的结果病例号实际检验结果130肾炎患者18,19号误判为健康3160健康38,41号误判为肾炎
13、5.1.5模型一的检验分析由表(1)中的检验结果可以看到在给出的60个病例号中,我们将18,19,38和41号判断错误,也就是说我们所建模型一对于该实际问题的检验准确度为:既然我们所建立的模型有这么高的准确度,为什么这四个病例号会误判呢?我们对检验结果进行分析。运用excel分别求出130号和3160号七种元素的平均值,并与18,19,38和41号就诊人员体内元素含量进行比较,见图(1)和图(2)。图(1):130号体内各元素含量与均值比较图(2):3160号体内各元素含量与均值比较由图我们发现, 19号体内元素的含量为20.7接近健康人的体内含量,但远高于肾炎病人体内的含量;41号体内元素的
14、含量为8.00肾炎患者体内含量很接近,但远低于健康人体内的含量;18号体内元素含量太低,而41号体元素含量太高;这四个人体内元素和元素的含量都很异常,按照均值推断,正常情况应该是患者体内这两种元素的含量远远低于健康人体内的含量,但事实刚好相反。由此我们可以推断这七种元素对肾炎患者的诊断有主次区别,对于这四位误判的检验分析可以得出,元素和元素可能起次要作用。5.2判别方法二5.2.1模型二的分析先用excel对表B.1所给数据进行处理,处理结果见下表(2):表(2):1到60号的数据分析130平均置信区间3160平均置信区间Zn143.1033123.0587,163.1479Zn186.617
15、5.51,197.68Cu12.3343310.0448,14.22Cu21.9236713.0534,30.7938Fe23.0666717.9325,28.201Fe62.0116733.7115,90.3078Ca698.1667597.27,799.0594Ca2511.1332036.30,2985.95Mg113.393395.90,130.885Mg295.1367288.8,361.4K201.1333104.128,298.137K90.3771.2074,109.5325Na526.8333414.5935,639.0731Na367.21276.08,458.411假设(
16、患者体内各元素含量的均值的集合),(健康者体内各元素含量的均值的集合)为该方法中的两个标准模式。最大隶属原则:原则1:设为给定的论域上的个模糊模式,为一个待识别对象,若,则认为优先归属于模糊模式。原则2:设为给定论域上的一个模糊模式,为U中的个待识别对象,若,则认为优先归属于模糊模式。择近原则:设论域上有个模糊集构成一个标准模型库为待识别的模型。若存在,使得 则称与最贴近,或者说把归并到类。我们根据模糊识别法中的择近原则来判断待识别的模糊集与标准模型库哪个最贴近,即求的值。如果,则应归并到模式,即该就诊人员为肾炎患者。,则应归于模式,即该就诊人员为健康人员。其中表示两个模糊集之间的贴近程度。贴
17、近度:由模糊集的性质可以知道,单独使用内积或外积还不能完全刻划两个模糊集A,B之间的贴近程度,模糊集的内积与外积都只能部分地表现两个模糊集的靠近程度。由模糊集的内积与外积的性质可知,内积越大,模糊集越靠近;外积越小,模糊集也越靠近。因此,可用二者相结合的“贴近度”来刻划两个模糊集的贴近程度较为适合。设A,B是论域U上的模糊子集,则称为A与B的贴近度。可见,当越大时,越大,越小,A与B越贴近。其中:表示两个模糊集A,B的内积;表示两个模糊集A,B的外积。5.2.2模型二的建立通过上述分析我们设待检查人员的各项指标的集合为,即集合为待识别的模糊集,(患者体内各元素含量的均值的集合),(健康者体内各
18、元素含量的均值的集合)为该方法中的两个标准模式。那么只需要分别求出,然后比较的大小,如果,那么待识别的模糊集贴近于,可以判断为该待测人员为肾炎患者;如果,那么待识别的模糊集贴近于,可以判断为该待测人员是健康的。根据最大隶属度原则,设为某就诊人员的一组指标的化验结果。确定模糊模式识别模型为: 5.3运用模型二进行检验:将题目中给出的60个病例号带入到模糊模式识别模型中,用matlab7.0.1软件对其进行检验(代码详见附录三),将检验结果整理,得到如下表(3):(其中用1表示,用0表示)。 表(3):模糊模式识别法对160号的检验结果病例号实际检验结果130号肾炎患者17,18,19,23号误判
19、为健康3160号健康没有误判5.4模型二的检验分析题中给出的病例号中,130号为肾炎患者,3160号为健康的。由整理得到的表格知:我们运用所建立的模型,对给出的60个病例号误判了4个,即将17号,18号,19号,以及23号肾炎患者误判为健康人。所以该模型的准确度为:.那么为什么我们所建立的模型会误判这四个病例号呢?我们分别求出130号和3160号体内各元素的平均含量,将这四个误判的就诊者体内元素含量与平均值进行比较。这四个病例号体内的七种元素含量与平均值的比较图见图(3):图(3):误判者体内各元素含量与均值比较由图(3)可以看出对于那些与肾炎患者体内相应元素差距很大,但是跟健康人体内含量相近
20、的元素,很可能是导致误判的原因。比如:19号体内元素的含量为20.7接近健康人的体内含量,但远高于肾炎病人体内的含量;这四个患者体内元素的含量都与正常值偏离较远,但接近肾炎患者体内该元素的平均含量;并且17,18,19号体内元素的含量都远高于健康人的体内含量。由此我们推断这些元素在对肾炎患者的判别时,存在主次,且,对结果的影响较大。6.问题二的求解6.1用两种模型进行判别问题二要求我们运用问题一中提出的判别方法,对表B.2中的30名就诊人员的化验结果进行判别,判定他(她)们是肾炎病人还是健康人。问题一中我们提出了两种判别方法,所以我们分别用这两种方法对这30个病历号进行检验。我们先用模型一中的
21、加权马氏距离判别法进行判别,运用matlab软件(代码详见附录四)将这30个病例号得化验结果数据带入,得到结果整理如下表(4):表(4):加权马氏距离判别法的检验结果患病61,62,64,65,66,67,68,69,72,73,76,79,83,8514个再用模型二中的模糊模式识别法进行判别,运用matlab软件(代码详见附录五)将这30个病例号得化验结果数据带入,得到结果整理如下表(5):表(5):模糊模式识别判别法的检验结果患病61,62,64,65,66,67,68,69,72,73,7611个6.2两种模型判别结果的比较由表(4)和表(5)我们可以看到,这两种判别方法的判别结果基本相
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 肾炎诊断问题分析 数学建模 肾炎 诊断 问题 分析 数学 建模
链接地址:https://www.31ppt.com/p-1769124.html