软件可靠性模型介绍Readppt课件.ppt
软件可靠信研究,浙江工业大学软件学院 报告时间:2008.11,目录,研究意义国内外研究现状软件可靠性概述软件可靠性模型介绍现有模型的不足 -基于迭代自生成神经网络的可靠性预测方法总结与展望,研究意义,随着计算机技术飞速发展,涌现出新的软硬件技术,但是软件技术的发展没有与硬件同步。一方面,人们对于软件的依赖性越来越强,各个领域都离不开软件,与人们的生活密切相关,金融系统、航空系统、军用软件等。另一方面,软件从设计到开发都有人的参与,难免存在漏洞和疏忽,这种潜在的威胁是不可避免的。加上网络技术的发展、病毒、黑客的恶意攻击、软件高级复用技术的发展,这些都给软件的可靠性评估提出了新的挑战。 软件应用的日益广泛,使人们对软件质量和性能的要求越来越高,可靠是衡量软件的一个重要特性,其定量的评估和预测受到了普遍关注,因此研究软件的可靠性评估技术具有现实意义。,国内外研究现状,最近几年,信息安全中的可信计算研究成为热门研究领域之一,但是目前关于可信计算的研究主要集中于硬件层面,对于软件的可信计算研究还是比较少的。软件的可靠性研究是可信计算的一个分支,也是薄弱环节。 国外的软件可靠性研究起始与20世纪70年代初,主要以可靠性建模为主,到了80年代中期出现了数以百计的软件可靠性模型,目前已有的100多种模型,但是还没有一个被证明可以适用于任何情况的最佳模型,都是基于不同的基本假设而建立的概率模型。 80年代后期进入了工程阶段,将工程实践与理论相结合,取得了一定的发展。目前对软件可靠性工程的研究归结为三个基本问题指标确定、指标的实现,及验证,并有了一系列的标准和手册可以参考,但是可靠性的相关技术仍然不够成熟,还需要进一步研究。,国内外研究现状,国内的软件可靠性研究始于80年代初,主要集中于应用研究和工具的开发。北京航空航天大学的蔡开元教授则从理论上对软件可靠性工程进行了论证,并提出了基于模糊理论的软件可靠性增长模型。在软件可信计算的研究方面,比较有成效的是国防科大的陈火旺等人,他们认为,软件系统的可信性质是指该系统需要满足的关键性质,当软件一旦违背这些关键性质会造成不可容忍的损失时,称这些关键性质为高可信性质。高可信软件系统中会涉及一个或多个关键性质,这些可信性质与软件本身的各种功能特性混合在一起,使得软件可靠性研究远比硬件可靠性研究复杂。 总的说来,国内软件可靠性研究虽然在理论上取得了一定的成绩,但是在工程实践方面的工作比较少,相当的有限,工作的水平也无法与国外同类工作相比拟。,可靠性概述,可靠性是软件产品故有的特性之一,软件产品的可靠性与软件缺陷有关,也和系统的输入和使用有关,即具有定性和定量两个方面,其定义如下:1.在规定的条件下,在规定的时间内软件不引起系统失效的概率2.在规定的间内所述条件下,程序执行所要求的功能的能力 软件可靠性指标是定量评估软件可靠性的依据,确定其指标要求是评估软件靠性的必要步骤,软件可靠性的主要度量指标如下:1.仿效硬件的可靠性指标A.可靠度 R (t) B.累计失效率 F (t)C.失效概率密度 f (t) D.失效率 E.平均故障间隔时间 MTBF 或平均故障前工作时间 MTTF F.平均维修时间 MTTR G.可用度 A,可靠性概述,2.软件特有的可靠性指标A.软件中的特有错误数;B.经测试,排错后的剩余错误数;C.经预测,下一次发生故障的时间等等3.软件可靠性评价及预测的一般步骤:A.获得实际的测试数据;B.基于一定的模型假设,选择可靠性模型;C.根据实际测试数据估计模型的参数;D.估计软件的可靠性指标(平均失效时间,失效率,可靠度等等)。,软件可靠性模型介绍,软件可靠性模型对于软件可靠性评估和预测起着核心作用,软件可靠性模型是随机过程的一种表示,通过这一表示,可以将软件可靠性或可靠性相关指标量(故障率、平均无故障时间等)表示成时间、软件产品特性或开发过程的函数。软件可靠性模型通常描述了软件可靠性对上述变量的一种依赖关系。目前被广泛采用的软件概念模型即输入输出模型从理论上描述了软件可靠性模型存在的合理性。,P,O,OF,软件可靠性模型介绍,软件可靠性模型分类按照软件失效过程的性质,可以把可靠性模型分成四类:面向时间的模型。这类模型以时间作为基准,研究软件的可靠性特征随时间变化的规律。最常用的方法是假定失效时间服从某一分布,分布的参数依赖于各时间间隔内程序的残留错误数。模型的参数通过实测的失效时间间隔来获得,然后估算各种可靠性指标。可以分为两个子类,失效时间间隔模型和失效计数模型。 面向输入数据的模型。这类模型的目的是建立软件的可靠性与输入数据的联系,用程序运行中的失效次数和成功次数的比例作为软件可靠性的度量。 面向错误数的模型。这类模型直接用程序中存在的错误数的多少来反映程序的可靠性,模型结果直观。,现有模型的不足,现有软件可靠性模型大多通过拟合已收集到的实测数据来预测软件在未来时间的失效数。这些的模型的基础都建立在各个不同的统计假设上,这些假设条件考虑的是模型本身,而不是程序,严重依赖与独立性和线性,因此就束缚和限制了软件可靠性模型的应用,同时也限制了每个模型的不同适应范围。 在实际应用中,由于软件错误和软件失效过程都是随机产生的,那些预先的假设的有效性也很难验证 ,使用不同的模型来预测软件会有不同的结果。 为了解决这个问题就需要一种通用的、不用任何假设,且在任何环境提供高精度的模型。,软件可靠性模型介绍,软件可靠性模型分类,随机过程模型,非随机过程模型,软件可靠性模型,马尔可夫过程模型(JM模型),非齐次泊松过程模型(GO模型),Musa执行时间模型,贝叶斯估计模型(LV模型),Seeding模型(Mills模型),基于输入域的模型,其他方法,基于迭代自生成网络的可靠性预测,神经网络是一种通用的具有任意精确性的非线性连续函数的近似器,因此可以运用到软件可靠性建模、评估和预测中。 传统的神经网络是认为设计网络结构,需要领域专家来设定网络的结构和参数,然后通过对样本的学习来调整连接权值,因而一种网络结构只有在特定的场合才能发挥出最佳效果。而SGNN (Self Generating neural Network)是在对样本的学习中形成一棵神经树SGNT(Self-Generating Neural Tree),整个结构包括神经元、神经元之间的联系和权值,都是在学习中采用非监督学习方法自动生成,因此适应性较好。,基于迭代自生成网络的可靠性预测,1.SGNN的基本定义:1)给定一个样本输入集合E=e i,其中e i=(ei1 ,ei2 e im);2)神经元nK是一个有序对(VK,CK), VK是神经元的权值向量, CK是子神经元集合;3)d( VK ,e i )是神经元VK与e i的距离;2.SGNN实现基本思想:1)首先根第一个样本e 1生成根节点node1;2)遍历样本插入新的节点;3)生成一颗树;4)最后可以运用水平优化和垂直优化使树达到良好的形状。,基于迭代自生成网络的可靠性预测,迭代自生成网络(ISGNN)由于SGNN的树过于高大,节点数目远大于训练样本数目,导致庞大的存储空间需求,也使学习分类预测的效率下降。改进措施:1)ISGNN改变SGNN中的优化顺序,在每一个样本进入的时候就进行水平和垂直优化;2)在每一个样本水平和垂直优化后,对SGNN进行剪枝。,3.,基于迭代自生成网络的可靠性预测,4.基于ISGNN的预测方法4.1 软件失效间隔时间数据的预处理把软件失效间隔数据映射到二维平面上,其中x轴为失效数,y轴为失效时间间隔,基于迭代自生成网络的可靠性预测,利用最小二乘法则拟合出一条最佳曲线,找到自变量和因变量之间的关系,y=F(x),生成M维向量作为样本输入。根据输入的样本向量, ISGNN生成SGNT,根据生成的树来预测样本。预测一个样本时,该样本的M维矢量与SGNN的每个节点进行计算,求它们的距离,找出最小的一个距离,即找到了那个与其距离最近的节点,将该结点还原就可以得到该样本的预测值。,总结与展望,根据软件可靠性的发展趋势,在可靠性模型方面还有许多问题有待于改进:1.目前存在的可靠性模型有100多种,现在一般是根据专家经验或者程序员的个人爱好来选模型,这就不能保证所选的模型一定适合,因此关键是要解决如何选择模型,使其产生最佳的效果。评估可靠性模型对软件可靠性预测的准确程度称为选择模型的核心问题,已形成的模型评价标准有:1)模型拟合性:由模型估计出的失效数据与实际失效数据的吻合程度。2)模型精确度:从预计的角度来反映模型评估的有效性,用序列似然度作 为模型精确性的度量。3)模型偏差:预测曲线和实际曲线在垂直方向上的最大距离。4)模型偏差趋势:用来检测模型偏差的可信性。5)模型噪音:模型噪声指出模型本身给预测引入噪声的程度,在预测过程 中引入的噪声越小越好。,总结与展望,2.不同的软件可靠性模型需要不同类型的测试数据,有不同的参数要求,所以要细化可靠性数据收集的方法,来保证原始数据样本的质量,提高预测评估和预测的效果。3.有专家指出软件可靠性模型之间存在着互补性,因此混合模型比单个模型要好,因此如何混合几个模型来预测也是很有意义的。,参考文献,【1】李红霞.可信计算与软件可信性研究.硕士论文【2】孙莉.组件软件可靠性估计研究.硕士论文【3】邱大山.软件可靠性预测方法的研究与应用.硕士论文,Company Logo,谢谢大家!,