《系统安全的可靠性.ppt》由会员分享,可在线阅读,更多相关《系统安全的可靠性.ppt(14页珍藏版)》请在三一办公上搜索。
1、第2章 系统安全的可靠性,学习目标,1了解计算机系统的可靠性概念2了解系统的容错性与避错技术3.掌握系统冗余容错软硬件技术4.熟悉常用的系统级容错模式5.了解常用的磁盘阵列结构,本章主要内容:),第2章 系统安全的可靠性,2.1 计算机系统的可靠性与容错性,2.1.1 计算机系统可靠性,下面是一些与系统可靠性相关的术语。(1)规定的条件:环境条件,使用条件,维修条件,操作技术。(2)失效:产品在规定的条件下和规定的时间内丧失了规定的功能。(3)失效率:指计算机在某一瞬间元件失效数与元件总数的比率。(4)可维护性:是指在规定的时间内,按照规定的程序和方法进行维修时,保持或恢复到能完成规定的功能的
2、能力。(5)可保持性:是指系统在给定的时间内可隔离故障或修复的概率。它表征了系统可以正常运行的效率。(6)规定的时间:通常指从判定故障到排除故障所需要的时间,包括故障诊断、故障定位、系统校正和恢复等时间。(7)计算机系统可靠性:通常用平均无故障时间(MTTF)来度量,即计算机系统平均能够正常运行多长时间,才发生一次故障。系统的可靠性越高,平均无故障时间越长。(8)计算机系统可维护性:用平均维修时间(MTTR)来度量,即系统发生故障后维修和重新恢复正常运行平均花费的时间。系统的可维护性越好,平均维修时间越短。,第2章 系统安全的可靠性,2.1.2 完美性与避错技术,硬件可靠性电路元器件部件整机环
3、境软件可靠性正确性可用性兼容性可信性,第2章 系统安全的可靠性,2.1.2 完美性与避错技术,软件可靠性与硬件可靠性的区别(1)最明显的是硬件有老化损耗现象,而软件不发生变化,没有磨损现象,但有陈旧落后的问题。(2)硬件可靠性的决定因素是时间,受设计、生产、运用的所有过程影响,软件可靠性的决定因素是与输入数据有关的软件差错,更多地决定于人。(3)硬件的纠错维护可通过修复或更换失效的系统重新恢复功能,软件只有通过重新设计。(4)对硬件可采用预防性维护技术预防故障,采用断开失效部件的办法诊断故障,而软件则不能采用这些技术。(5)为提高硬件可靠性可采用冗余技术,而同一软件的冗余不能提高可靠性。(6)
4、硬件可靠性检验方法已建立,并已标准化且有一整套完整的理论,而软件可靠性验证方法仍未建立,更没有完整的理论体系。(7)硬件可靠性已有成熟的产品市场,而软件产品市场还很新。(8)软件错误是永恒的、可重现的,而一些瞬间的硬件错误可能会被误认为是软件错误。,第2章 系统安全的可靠性,2.1.3容错技术,容错技术通过硬件冗余或软件的方法都可以从很大程度上提高系统的可用性。硬件冗余主要是通过在系统中维护多个冗余部件如硬盘、网线等来保证工作部件失效时可以继续使用冗余部件来提供服务;而软件的方法是通过软件对集群中的多台机器的运行状态进行监测,在某台机器失效时启动备用机器接管失效机器的工作来继续提供服务。,第2
5、章 系统安全的可靠性,2.1.3容错技术,容错的概念:容错计算机系统:容错技术:设计与分析容错计算机系统的技术.容错计算:不希望事件的检测 损坏估价 不希望事件的恢复 处理和继续服务容错的实现:冗余容错系统的工作过程:自动侦测-自动切换-自动恢复容错技术的发展:网络容错,第2章 系统安全的可靠性,2.2 系统冗余,2.2.1冗余容错技术,在系统结构上,通过增加冗余资源的方法来掩盖故障造成的影响,使得即使出错或发生故障,系统的功能仍不受影响,仍能够正常执行预定的任务。从系统功能上,硬件冗余、软件冗余与数据冗余都是以增加“多余的设备(硬件、软件或数据)”为代价的。,第2章 系统安全的可靠性,2.2
6、 系统冗余,2.2.1冗余容错技术,硬件冗余:静态冗余动态冗余硬件冗余软件容错:概念:1 具有屏蔽错误能力2 自动恢复到正常状态 3 仍能完成预期功能 4 具有容错能力基本原理:不同程序不同空间依次运行,第2章 系统安全的可靠性,容错软件设计的基本技术,容错软件的相异性设计准则各冗余软件由相互独立的不同人员进行开发。各冗余软件以不同的形式说明。各冗余软件的设计评审的参与人员不重复。各冗余软件的最终规范及最终设计、最终编程由不同的审核人员对照软件需求、软件规范、软件设计进行审核。如果开发采用了CAD工具,则各冗余软件应采用不同的CAD工具各冗余软件分析测试程序的规范、测试方式、测试程序,尽可能由
7、不同的互相独立的课题组人员开发。各冗余软件应在算法上相异。各冗余软件应在逻辑结构上相异。如有可能,各冗余软件最好由不同开发单位设计,开发单位之间是相互独立的。各冗余软件用不同的程序设计语言设计。各冗余软件用不同的编译程序或汇编程序翻译成目标代码。,第2章 系统安全的可靠性,2.3 系统级容错,2.3.1 常见的双机容错模式,第2章 系统安全的可靠性,2.3.2 计算机集群系统,1)三机表决系统在三机表决系统中,三台主机同时运行,由表决器根据三台机器的运行结果进行表决,有两个以上的机器运行结果相同,则认为该结果为正确。现在实际应用中当三机中坏掉一台后就当作双机备份系统来用。2)集群系统均衡负载的
8、双机或多机系统就是集群系统。DEC公司最早在其VAX系统上实现了集群技术,多服务器集群系统的主要目的是使用户的应用获得更高的速度、更好的平衡和通信能力,而不仅仅是数据可靠性很好的备份系统。,第2章 系统安全的可靠性,2.3.3软件容错方法,第2章 系统安全的可靠性,2.4 容错技术的应用,2.4.1 RAID磁盘阵列特征,磁盘阵列RAID容错方案是目前应用最广泛的容错技术。RAID系统也属于部件级容错,它是由IDE-EIDE-SCSI-DAC接口发展而来。1)RAID的数据保护措施RAID的数据保护措施IDE(integrated device electronics)集成设备电路仅能支持2个
9、磁盘;而增强型IDE接口(EIDE)可支持4个磁盘;小型计算机系统接口(SCSI)可支持多个磁盘(7-15个);磁盘阵列控制器(disks array controller,DAC)可支持多个分组和多个磁盘。RAID(redundant array of inexpensive disks)磁盘阵列,是一种由多块廉价磁盘构成的冗余阵列,包含多块磁盘,在操作系统下作为一个独立的大型存储设备出现,作为逻辑上的一个磁盘驱动器来使用。作为一种数据保存手段,RAID提供了在专用服务器中接入多个磁盘(专指硬盘)的服务。RAID以磁盘阵列方式组成一个超大容量、响应速度快、可靠性高的存储子系统,以冗余技术增加
10、其可靠性,以多个低成本磁盘构成磁盘子系统,提供比单一硬盘更完备的可靠性和高性能,提升了硬盘速度,确保数据的安全性,因此,RAID被广泛地应用在服务器体系中。目前工业界公认的标准是RAID0RAID6.2)RAID的优点(1)成本低,功耗小,传输速率高。在RAID中,可以让很多磁盘驱动器同时传输数据,远远超过单个磁盘驱动器的传输速度。(2)提供容错功能,因而具有更高的安全性。(3)RAID与传统的大直径磁盘驱动器相比,价格低,因此有效的减低了存储成本。3)不同类型的RAID特点(1)RAID0:数据不能容错,但速度快。(2)RAID1:数据可以容错,但对容量的要求较高,成本高,但速度一般。(3)
11、RAID3-5:数据可容错,速度快,成本较RAID0和RAID1低。,第2章 系统安全的可靠性,2.4.2 RAID磁盘阵列类型,RAID7突破了以往RAID标准的技术架构,采用了非同步访问,极大地减轻了数据写瓶颈,提高了I/O速度。所谓非同步访问,即RAID7的每个I/O接口都有一条专用的高速通道,作为数据或控制信息的流通路径,因此可独立地控制自身系统中每个磁盘的数据存取。如果RAID7有N个磁盘,那么除去一个校验盘(用作冗余计算)外,可同时处理N1个主机系统随机发出的读/写指令,从而显著地改善了I/O应用。RAID7系统内置实时操作系统还可自动对主机发送过来的读/写指令进行优化处理,以智能化方式将可能被读取的数据预先读入快速缓存中,从而大大减少了磁头的转动次数,提高了I/O速度。RAID7可帮助用户有效地管理日益庞大的数据存储系统,并使系统的运行效率提高至少一倍以上,满足了各类用户的不同需求。,
链接地址:https://www.31ppt.com/p-6597648.html