毕业设计(论文) 肾炎诊断问题.doc
《毕业设计(论文) 肾炎诊断问题.doc》由会员分享,可在线阅读,更多相关《毕业设计(论文) 肾炎诊断问题.doc(32页珍藏版)》请在三一办公上搜索。
1、 肾炎诊断问题一问题重述1二问题分析22-1 问题一分析22-2 问题二分析32-3 问题三分析32-4 问题四分析32-5 问题五分析3三模型假设与符号说明43-1 假设43-2 符号说明4四模型的建立与求解44-1 问题一的模型及求解54-1-1模型建立与求解5模型:两类总体fisher判别法5模型:BP误差反传神经网络判别法84-1-2 模型检验与结果分析94-1-3模型评价114-2 问题二求解与分析114-2-1:问题二的模型建立与求解114-2-2:问题二的计算结果与分析134-3 问题三建模与求解134-3-1:问题三的模型建立与求解134-3-2:主成分分析模型的结果检验与分析
2、154-4 问题四求解与分析164-5 关于问题二和问题四的结果分析与改进174-5-1 结果分析174-5-2 模型修正17五关于肾炎检测问题的进一步讨论及模型的推广18六参考文献19七附录19附录一:化验结果19附录二:部分程序代码22一问题重述人们到医院就诊时,通常要化验一些指标来协助医生的诊断。诊断就诊人员是否患肾炎时通常要化验人体内各种元素含量。表B.1(见附录一)是确诊病例的化验结果,其中130号病例是已经确诊为肾炎病人的化验结果;3160号病例是已经确定为健康人的结果。表B.2(见附录一)是就诊人员的化验结果。我们的问题是:问题一:根据表B.1中的数据,提出一种或多种简便的判别方
3、法,判别属于患者或健康人的方法,并检验你提出方法的正确性。问题二:按照问题一中提出的方法,判断表B.2中的30名就诊人员的化验结果进行判别,判定他(她)们是肾炎病人还是健康人。问题三:能否根据表B.1的数据特征,确定哪些指标是影响人们患肾炎的关键或主要因素,以便减少化验的指标。问题四:根据问题三的结果,重复问题二中的工作。问题五:对问题二和问题四的结果作进一步的分析。二问题分析2-1 问题一分析该问要求根据表B.1中的数据,提出一种或多种简便的判别方法,判别属于患者或健康人的方法,并检验所提出方法的正确性。模型:表中展示了Zn, Cu,Fe,Ca,Mg,K, Na七种元素在确诊病人中的含量,要
4、想通过这七个观测指标判断某病人健康与否,首先,应分别用变量表示这七个观测指标,然后建立一个含有这七个变量的判别函数,通过将观测值带入函数计算出一个结果,找出一个固定的判别方法,判断所得结果属于哪一类。这是一个典型的两类总体判别问题。考虑到观测数据有限,为达到最佳的利用效果,也为了更加科学合理,在计算过程中,我们选取了四十组观测数据,采用fisher判别法建立模型并求解判别函数,再用余下的二十组观测数据进行检验,得出该模型的准确性,并对结果进行可靠性分析。模型:我们可以利用BP神经网络进行训练的方法判定就诊人员是否患病。将患者与健康者的指标进行训练,在建立模拟仿真网络对待测样本进行模拟,从而作出
5、诊断。本问以表1中的样本,对样本进行0-1 规划,以0表示健康人,以1表示肾炎患者,利用MATLAB软件对BP神经网络进行编程求解。并对剩下的10 名健康人和10 名肾炎患者进行了判定检验(如图4 所示) .最后,还需要对两个模型进行综合分析考虑,主要结合模型求解的准确性及实用性,进行误差比较,综合分析等,以选出最优模型,进行后面问题的求解。2-2 问题二分析该问要求按照问题一中提出的方法,对表B.2中的30名就诊人员的化验结果进行判别,判定他(她)们是肾炎病人还是健康人。通过第一问的求解,已经有了一个能较为准确地判别一个人是否患有肾炎的方法,在此问中,就只需把表B.2中的30名就诊人员的化验
6、结果与一问中的两个模型进行对应,带入求解,根据模型的使用方法,就能判定他(她)们是肾炎病人还是健康人。2-3 问题三分析本问要求根据确诊病例的化验结果的数据特征,确定哪些指标是影响肾炎诊断的关键或主要因素,以便减少化验指标。为此,我们建立了样本主成分分析模型进行分析,利用降维的思想,将多个指标转化为几个综合指标,即主成分。该模型以各主成分对原始变量方差贡献的大小为标准对其进行排序,并求出其贡献率。一般情况下,当p个变量的累计贡献率超过85%时,就能确定需要提取的主成分个数为p。再将载荷矩阵的转置乘以由挑选出的各主成分贡献率所构成的矩阵,得出每个指标的重要性,绝对值越大表明其对肾炎诊断的影响越大
7、。从而依次选出这q个主要指标,达到简化分析的作用。为减少工作量,在验证模型准确率时,我们只选取了模型,按照一问中的方法建立模型,进行判别并检验正确率。2-4 问题四分析本问题与二问相同,也是要求对表B.2中的30名就诊人员的化验结果进行判别,判定他(她)们是肾炎病人还是健康人,且采用的模型和判别方法与二问中相同,不同点在于带入模型的观测指标数量有所变化。经过第三问的建模与求解,判定一个人是否患肾炎的指标减少了,只保留几个关键因素,这样,判别模型得到进一步简化,在对就诊人员进行判定的时候就更加便捷。2-5 问题五分析本问题要求对第二问和第四问的结果进行分析。与第二问相比,第四问中的求解过程只考虑
8、了几个关键因素,而不是全部七个指标,化验指标的减少必然会使就诊成本降低,看病效率提高,但更重要的是要保证诊断结果与之前一致,否则就会影响诊断的准确性。通过这一问的分析,就能判断第四问所取的关键因素是否具有足够的代表性。如果结果分析一致,则说明所选因素能准确判断一个人是否患有肾炎;如果不一致,则分析偏差出现的原因,并重复第四问的工作,重新确定主要因素。在此基础上就影响肾炎诊断的主要因素谈谈如何有效地进行肾炎诊断,分析模型的推广。三模型假设与符号说明3-1 假设1)题中所给的内容和数据都是真实可信的,确诊病例情况(患病或是健康)都是准确无误的;2)除了表中列出的元素外,其他元素对是否会患肾炎的影响
9、很小;3)没病的个体都是健康体;4)忽略人体内其它元素对问题中七种元素含量的影响;5)化验结果中每个元素的值之间没有影响;6)假设医生不会仅仅依靠化验结果对患病情况作出最终判断,化验仅仅作为医生诊断的一种辅助手段,所以化验结果单方面的现实结果可以跟实际有一定程度的偏差。7)两总体肾炎病人和非肾炎病人化验结果中各元素的期望值,标准差和由数据给出的样本的统计量是一致的。 3-2 符号说明: 第一类总体,即表B.1中1至30号病例所组成的总体: 第二类总体,即表B.1中31至60号病例所组成的总体: 第一类总体中第i个观测指标: 第二类总体中第i个观测指标: 第i个观测指标的均值: 第i个观测指标的
10、系数除模型以外,所有检测结果中,1表示患有肾炎,2表示健康。四模型的建立与求解4-1 问题一的模型及求解4-1-1模型建立与求解模型:两类总体fisher判别法1)取全部七个观测变量,构造判别函数:其中,系数 确定的原则是使两组间的区别最大,而使每个组内部的离差最小。2)从表B.1中的两个总体 中分别抽取20个样本,每个样本都观测全部七个指标,得表一:样本观测值总体病例号ZnCuFeCaMgKNa116615.824.5700112179513218515.731.570112518442731939.825.9541163128642415914.239.789699.22397265226
11、16.223.860615270.321861719.299.2930718745.5257720113.326.655110149.4141814714.53065910215468091728.857.8655175.798.43181015611.532.56391071035521113215.917.757892.4131413721218211.311.3767111264672131869.2637.195823373347141628.2327.162510862.4465151506.63216271401796391615910.711.761219098.53901711
12、716.17.0498895.51365721818110.14.0414371841015421914620.723.8123212815010922042.310.39.762993.74398883121319.136.22220249401683217013.929.8128522647.93303316213.219.8152116636.2133342031390.8154416298.93943516713.114.1227821246.31343616412.918.6299319736.394.5371671527205626064.62373815814.437102510
13、144.672.53913322.83116334011808994015613532267471090228810411698308106899.1532894224717.38.65255424177.9373431668.162.81233252134649442096.4386.9215728874219451826.4961.738704321433674623515.623.4180616668.81884717319.117249729565.82874815119.764.220314031828744919165.43553613921376885022324.4863603
14、35397.7479将属于不同总体的样本带入判别函数,得 对以上两组等式分别左右相加,再除以相应的样品个数,则有第一组样品的“重心” 第二组样品的“重心” 为使判别函数能很好地区别来自不同总体的样品,则需满足:(1)来自不同总体的两个平均值 相差越大越好。(2)对于来自第一个总体的,他们的离差平方和越小越好,同样越小越好。综上两点,就是要求越大越好。利用微积分求极值的必要条件,求得可使I达到最大的。求解过程如下计算量总体间的离差矩阵S其中可以证明,最有判断系数为如下方程的解即利用MATLAB软件编程(见附录二)计算,结果见表二。3) 求临界值,在两总体先验概率相等的假设下,取为的加权平均值=
15、-0.1131模型:BP误差反传神经网络判别法1.首先建立BP神经网络模型。神经网络模型是单个并行处理的集合,BP神经网络采用监督学习方式,在网络投入使用前使用一个样本数据集来训练神功神经网络。如图二,学习过程由正向传播和反向传播组成。在正向传播过程中,输入信号从输入层经隐层单元逐层处理,并传向输出层,每一层神经元的状态只影响下一层神经元的状态。如果在输出层得不到期望的输出,则转入反向传播,将输出信号的误差沿原来的连接通络返回。通过修改各层神经元的权值,使得误差信号最小。学习算法如图一所示。图一:学习算法框图 图二:BP神经网络示意图根据题设,把表一中的20个患者和20个健康人的七项指标作为输
16、入项,以407的矩阵输入,再以0/1代换的思想,患病看作是1,健康看作0,以110的矩阵为目标输出。通过训练,不断修改权值,得出最终结果。2.模型的求解1)能量函数选取 平方型误差函数为2)隐层数取1,隐层单元数取73)传输函数选取S型函数 通过MATLAB软件,编写程序(见附录二),训练结果如图所示 图三:神经网络训练图4-1-2 模型检验与结果分析模型:将表B.2中余下的二十组观测数据带入判别函数进行求值,由于,当观测样品带入判别函数后,若,则判定为第一组,即该就诊人员患有肾炎;若 ,则判定为第二组,即该就诊人员健康。判别结果如表二所示:表二:fisher模型检验结果病例号y值临界值判断类
17、别原类别210.034-0.11311122-0.02241123-0.09031124-0.00261125-0.08141126-0.00041127-0.017611280.00951129-0.01181130-0.00271151-0.27042252-0.18452253-0.15892254-0.15292255-0.30432256-0.25112257-0.32622258-0.18022259-0.15612260-0.105612在二十组数据中,仅有一组发生了误判,为60号病例。可得该模型的正确率为95% 模型: 运用以上求解所得神经网络,对21至30号,51至60号数据
18、进行判别,检验结果如下图所示:可以看出,仅有第七组数据发生了误判,正确率同样为95%。由于建模过程中使用的四十组观测数据与检验时所用的20组数据不重复,有效地避免了数据间的相互影响,彼此独立,因而检验结果具有很强的可靠性,同时,95%的准确率也符合要求,因此可以这两个模型对就诊人员进行判别。4-1-3模型评价模型优点:本问所建立的两个模型简单易懂,对总体的分布类型没有要求,都能够较为准确地解决该肾炎诊断问题,由题中所给数据,计算结果准确率都达到了95%。其中,BP神经网络能通过学习带正确答案的实例集自动提取“合理的”求解规则,即具有自学习能力。两个模型在生活中的应用都很广,可移植性强。.模型的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 毕业设计论文 肾炎诊断问题 毕业设计 论文 肾炎 诊断 问题
链接地址:https://www.31ppt.com/p-2299324.html