电子产品质量与可靠性技术课件.ppt
电子产品质量与可靠性技术,目 录,第一篇 可靠性参数与模型P1-100第二篇 电子产品可靠性预计.P101-125第三篇 失效模式、影响及危害性分析( FMEA).P126-153第四篇 可靠性设计.P154-249,第一篇. 可靠性参数与模型,1.可靠性概念与指标,产品的寿命特性,产品的可靠性定义, 产品的可靠性就是在规定的条件下,在规定的时间内、产品完成规定功能的能力。 产品可靠性定义包括下列四要素: 规定的时间; 规定的环境和使用条件; 规定的任务和功能; 具体的可靠性指标值; 对于一个具体的产品,应按上述各点分别给予具体的明确的定义。,时间是广义的:小时、公里、次数、字符数,可靠性的特征量, 可靠度 定义:是指产品在规定的条件下,在规定的时间内、产品完成规定功能的概率。它是时间的函数,记作R(t),也称为可靠度函数。 当t=0时,R(0)=1;当t=时,R()=0,R(t)=P(Tt), 可靠度R(t)与可靠寿命tR0 可靠度:产品在规定的条件下,在规定的时间期间(t1,t2)内 完成规定功能的概率。记作R(t1,t2),特别记R(t)=R(0,t) 可靠寿命:对特定的R0,若tR0使R(tR0)=R0,则称tR0为与可靠度R0 相对应的可靠寿命 例1:某彩电工作台1年的可靠度为0.94,即R(1年)=0.94;亦即该彩电可靠度为0.94时的可靠寿命t0.94=1年 例2:某通讯设备工作台3年可靠度为0.90,即 R(3年)=0.90 t0.90=3年 例3:神舟5号发射成功的可靠度为0.99; 例4:神舟5号火箭发射成功的可靠性为0.997., 不可靠度 定义:是指产品在规定的条件下,在规定的时间内、产品不能完成规定的功能的概率。它也是时间的函数,记作F(t),也称为累积F(t)=p(T t),R(t)+F(t)=1,失效概率密度f(t)定义:失效概率密度是累积失效概率F(t)对时间的变化率,它表示产品寿命落在包含t的单位时间内的概率,即t时刻,产品在单位时间内失效的概率,瞬时失效率(t),(简称失效率), 定义:是在t时刻,尚未失效的产品,在该时刻后的单位时间内发生失效的概率。, 通常可以采用每小时百分之一或千小时的百分之一来作为产品失效率的单位,但对具有高可靠 要求的产品来说,就需要采用更小的单位来作为失效率的基准。现在常采用菲特作基准单位。菲特这一单位的数量概念是:1菲特(FIT)=1 10-9/小时=1/ 10-6千小时 实际上,这就表示了10亿个元件小时内只允许有一个产品失效,亦即在每千小时内,只允许有百万分之一的失效概率。,失效率的单位,失效率的等级,可靠性指标及其内在关系,MTBF和MTTF, 对不可维修的产品的平均寿命 是指从开始投入工作,至产品失效的时间平均值。也称平均失效前时间,记以MTTF,它是英文(Mean Time To Failure)的缩写。,平均失效前时间-MTTF(Mean Time To Failure)的理解,T1,T2,T3,T4,T5, 对可维修产品而言,其平均寿命是指两次故障间的时间平均值,称平均故障间隔时间,习惯称平均无故障工作时间,用MTBF记之,它是英文(Mean Time Between Failures)的缩写.,平均故障间隔时间-MTBF (Mean Time Between Failure)的理解,MTBF=Ti/n,Tn, 对于指数分布(大部分电子设备适用):(t)=常数时,平均维修间隔时间-MTTR (Mean Time To Repair), 对可维修产品还有平均维修时间,它是设备处于故障状态时间的平均值,或设备修复时间的平均值。记以MTTR,它是英文(Mean Time TO Repair)的缩写。, 可维修产品的有效度A,它表示设备处于完好状态的概率。,维修性指标,Classes lf High Availability System,2 插入语 可靠性的重要性,可靠性是质量的时间指标,以可靠性为中心的质量观,可靠性是什么?,十年包换? 能否达到? 如何达到? 如何更好? -用可靠性工程来回答,一个电度表的故事,如何计算与回答,可靠度?用户要求?产品翻修率?客户满意度? 6西格玛,R-可靠度,越大越好T-任务时间,客户要求的时间-失效率,越小越好,可靠性是定量的概率统计指标 在设计中它必须是可预计的,在试验中它必须是可测量的,在生产中它必须是可保证的及在现场使用中它必须是可保持的。,系统可靠性与维修性指标可以从两方面论证:一是研究被论证系统应该具有或侧重于哪些可靠性和维修性指标;二是决定这些指标水平的高低。,3 可靠性、维修性指标的论证和确定,a、装备的类型,例如对坦克为平均无故障里程(MMBF)、对于飞机为平均无故障飞行小时(MFHBF)、对一般设备则为平均无故障时间(MTBF); b、装备的使用要求(战时、平时、一次使用、重复使用)对于一次使用的产品则为成功率(例导弹); c、装备可靠性的验证方法,厂内试验验证则用合同参数,外场验证则用使用参数。,可靠性指标的选择的依据,实际的可靠性指标,1为产品MTBF检验下限值0为产品MTBF检测上限值使用方风险率生产方风险率dm鉴别比,不同寿命分布的可靠性函数,指数分析正态分布对数正态分布威布尔分布,可靠性的统计术语的误区,寿命与MTBF(平均无故障工作时间),点估计与区间估计概念(下雨),4 客户要求的可靠性指标分解, 一个产品的设计寿命为15年,是要求15年内其累积的故障率不超过10%, 一个产品的设计寿命为15年,要求15年时其第年的故障比例不超过1%,5 可靠性模型的分析与建立,可靠性模型的组成, 何为产品可靠性模型 为了对产品的可靠性进行定量分配和估量,根据产品组成或完成规定任务时的功能关系与拓扑结构,建立的数学模型. 可靠性模型包括可靠性框图和可靠性数学模型二项内容, 可靠框图应与产品的工作原理及功能框图相协调,功能框图表示产品中各单元之间的功能关系,而原理图则表示产品各单元之间的物理关系.可靠性框图用来简明扼要、直观地描述产品为完成任务的各种组合(串并联框图)。为了编制可靠性框图必须全面了解产品完成任务的定义及使用的任务剖面,并给出一般的和专门的假设。,可靠性模型,数学模型,假设各单元寿命服从指数分布,MTBFs=1s,建立产品的可靠性模型, 产品的可靠性模型是进行产品可靠性指标定量分配和预计,以及开展产品可靠性分析的基础。 典型的可靠性模型有: 串联、并联(热储备)、混联、表决(k/n)、冷储备(非工作)和网络系统等。 有基本可靠性与任务可靠性模型之分。 参考标准: GJB813可靠性模型的建立和可靠性预计,绘制可靠性构图应依据以下八个原则:, 框图标题每个可靠性框图应该有一个标题,该标题包括产品的标志、任务说明及寿命剖面的有关部分,以及对工作方式的说明。 规定条件每个可靠性框图应规定有关的限制条件。这些条件将影响框图形式的选择、可靠性参数或可靠性变量,以及影响绘制框图时所做的假设或简化。 完成任务应该用专门的术语规定任务的完成,并确切地说明在规定的条件下,可靠性对产品完成任务的影响。,可靠性模型的程序, 方框顺序可靠性框图中的方框在串联环节中的相对位置是没有物理意义的,但是,为了表示工作过程中事件发生的顺序,应按一定的逻辑顺序排列。 方框含义可靠性框图中的每个方框应只代表构成产品的一个功能单元,所有方框均应按要求以串联、并联、旁联或其组合形式连接。 方框标志可靠性框图中的每一个方框都应进行标志为避免混淆,对具有许多方框的框图应按照有有关编码系统的标准统一规定的代码进行标志。应专门说明在可靠性模型中未包括的产品中的硬件或功能单元。 可靠性变量每个方框应规定可靠性变量,以表明每个方框完成其规定功能所需的工作时间(循环次数、或事件等),并用于计算方框的可靠性。,可靠性模型的程序,构画产品可靠性方框图示例, 可靠性方框图只表明组成产品的分系统或组件与产品的可靠性关系的连接,通常,它是产品组成子系统或组件的串、并联的某种组合,但组件在串联环节中相对位置是没有物理意义的,它只表明产品完成规定任务所必须保证的各功能组件的关系。,储备电源系统的原理图和可靠性框图,可靠性框图应注意的事项, 各方框之间的所有边线不具有可靠性值。这些边线只用来表示框图中各方框的连接关系,而不代表与产品有关的导线和连接器。导线和连接器作为一个独立的方框或构成一个单元或功能的一部分。 产品的所有输入在规定的极限之内。 就故障概率而言,框图中一个方框所表示的单元或功能不受其他方框的影响。 对于电子设备,若电路中采用可靠性并联结构或其他储备方式时,其框图的分解与绘制应表示这种结构。不可简单地以PCB板来区分。,可靠性模型的程序,不能与电路的串并联混淆,图A,图B,利用故障树分析(FTA),可以构划复杂的系统的可靠性框图,关于该部分,将另文介绍。,建立可靠性数学模型,建模方法 普通概率法 利用普通的概率关系式,根据产品的可靠性框图建立可靠性数学模型。这种方法可用于单功能和多功能的系统。 布尔真值表法 利用布尔代数法,根据产品可靠性框图建立可靠性数学模型。这种方法比普通概率法麻烦,但在熟悉布尔代数的情况下,这种方法还是有用的。它适用于单功能及多功能的系统。,可靠性模型的程序,逻辑图法 利用逻辑图根据可靠性框图建立可靠性数学模型。这种方法比普通概率法麻烦,但它是布尔真值表法的简化方法,通过各项合并来简化任务可靠度公式。蒙特卡罗模拟法 利用随机抽样方法根据可靠性框图进行可靠性预计。当已知产品中各单元的概率(或等效可靠性参数),但任务可靠性模型过分复杂,难以推导出一个可以求解的公式时,可采用蒙特卡罗模拟法。这种方法不是产品一个完成任务的通用公式,而是根据产品各单元的概率和可靠性框图,计算产品完成任务的概率。作为一个例子,下面用普通概率法来建立串联系统和并联系统的数学模型。,可靠性模型的程序,串联系统,定义:系统中的下属几个组件全部工作正常时,系统才正常;当系统中有一个或一个以上的组件失效时,系统就失效,这样的系统称串联系统。串联系统的可靠性框图就是下属几个组件的串联图。设系统下属组件的可靠性度分析为, 用Ss和Si分别表示系统和单元的正常工作状态,则依据串联系统的定义,串联系统中正常事件是“交”的关系,逻辑上为“与”的关系,系统要正常工作,必须各子系统都正常工作,则有,系统正常工作的概率为各单元概率之积,因此,由于,所以,对于指数分布,并联系统,定义:系统中的几个下属组件,只要其中一个工作正常,则系统就正常工作,只有全部组件都失效时,系统才失效,这样的系统就称并联系统。并联系统的可靠性方框图为n个组件的并联图。,设组成组件的可靠性分别为相应组件的失效(故障)概率分别为并设并联系统的失效(故障)概率Qs, 用Ss和Si分别表示系统和单元的正常工作状态,用Fs和Fi表示系统和单元不正常工作,则依据并联系统的定义,并联系统中不正常事件是“交”的关系,逻辑上为“与”的关系,系统要不正常工作,必须各子系统都不正常工作,则有,系统不正常工作的概率为各单元不正常工作概率之积,因此,由于,所以,对于指数分布,若失效率用表示,当N个相同时,则,可靠性数学模型的分析实例, 某设计中,用7个数据位传递数据,数据传递模块的RAM经常出错,为了提高共传输数据的可靠性,增加了四个数据位,用于校验。当有一位出错进可以纠正。, 分析 加了数据校验后,其中任何一个数据信号出错都可以纠正,即不再出错,但是,若同时有两个以上的数据位出错时,检验是无法修正的。,假定某一时刻一个数据位出错的概率为P(例如10%),这时刻存储器芯片的出错的总概率可能是PTOL,那么,经这种检验处理后,这一时刻,存储器芯片出错的概率约为P TOL Y。之所以以为“约”,是因为不考虑硬件的失效。计算结果见附表,此处的可靠性是不随时间变化的。,本例N=7,N数据位数,K校验位数;Ri数据位的可靠度,n=N+K,思考, 某电源系统,用7805稳压器稳压,两个并联使用,建立其可靠性模型:,表决模型(k/n)的可靠性计算, 组成系统的n个相同单元中,只需要其中k个单元完好,系统就能成功完成任务。,其中,二项系数,r=k,冷储备(非工作)模型的可靠性计算, 组成系统的n个单元中,只有其中1个单元工作,系统就能完成任务;当它发生故障时,通过切换,系统继续能成功完成任务,直到所有单元都发生故障。,通常设切换开关可靠度为Rd=1,系统的可靠性计算 方法概述(1), 一般的方法经过由元件到组件,由组件到整机,由整机到系统这种逐级计算法,因为: 整机扬并联贮备,元件数增加了,而整机的可靠必将有所提高,但按元件失效率累加的系统失效增加了。 同样的元件在不同的线路中使用,其可靠性也可能不同。 “系统”是广义的:系统对下属子系统或整机,整机对下属组件,组件对下属部件、元件等均可称为系统。, 系统可靠性的计算方法很多,如数学模型法、真值表法、状态变换分析法、失效树法、贝叶斯法和蒙特卡罗法(Monte-Carlo Method)等。对各种方法的运用取决于产品的类型、已知条件和要求。 系统可靠性的计算方法,在整机和系统可靠性的定量计算中(如可靠性预计、可靠性根本和可靠性评审)都要用到,因此应引起重初见;但在各种运用中,应注意各种方法的条件和适用对象。,系统的可靠性计算 方法概述(2),串联、并联系统可靠性的计算, 由产品的可靠性框图,写出系统的可靠性数学表达式的方法很多。采用串联、并联系统可靠性公式进行化简是常用的方法。例,对下图(a)所示的系统,化成下图(b)所示的串联系统,若以小写字母代表各组件的可靠度时,化简后的、两上环节的可靠度表达式如下:,化简后两个环节的可靠度表达式如下, 如果各组件可靠度为已知,代入其可靠度表达式, 便可算出系统的可靠度。,可靠性指标的分配, 在研制具有可靠性指标要求的电子设备时,会遇到可靠性指标的分配问题,它是可靠性预计的逆过程,即在已知系统可靠性指标时,如何考虑和确定其组成单元的可靠性指标值。,可靠性分配考虑的因素, 子系统复杂程度的差别 子系统重要程度的差别 子系统运行环境的差别 子系统任务时间的差别 子系统研制周期的差别 对于个别研制周期长的单元,允许反复改进设计的时间较紧,在分配指标时应适当放宽。 作为一项设计,除了满足性能和可靠性指标之外,还应满足如重量、体积成本等一些要求。因此,如何在重量、体积和成本等一些限制条件下,使产品的可靠性分配方案更为合理,也是可靠性分配要考虑的问题之一。,考虑复杂度和重要度的分配方法, 这个方法是美国电子设备可靠性顾问团(AGREE)首先提出来的,也称AGREE分配法。 这个方法是假定设备的故障时间符合指数颁布的。这一假设对大部分系统和整机均适合。 各装置的基本组成单元数,反映了各装置的复杂程度。, 各装置的基本组成元件数 仅计算有源器件个数 等效有源器件数,等交有源器件数的粗略折算:,重要度, 第i个装置的重要度定义如下:第i个装置的 故障引起系统发生故障的概率为:,重要度的确定, 此式的含义是,引起系统故障的某装置的故障概率与该装置的故障概率之比 若给不出确切的统计数值,还可用经验评分法确定之,式中:di-对某装置的经验得分数,dic。c-总分值,讨论,考虑装置复杂度之后的分配方式(AGREE法),(子系统的MTBF分配值),(子系统的失效率分配值),计算示例,综合因子分配法(工程加权法), 本可靠性分配方法除考虑产品的重要度和复杂度外,还考虑环境条件、元器件质量标准化程度、工艺能力和维修等工程技术发展不平。 综合因子 Si=V/Vi 其中: 各部分MTBFi分配值为:MTBFi=SiMTBFs例:某系统MTBF指标为40h,各分机的可靠性应如何分配,可靠性指标分配应注意的事项, 可靠性指标分配应与产品设计同时进行、尽早明确,为可靠性设 计提供依据; 可靠性指标分配应随产品研制阶段的深入反复进行,以逐步达到科学、合理、可行; 为了有效减少分配反复次数,前期分配尽可能留有余量; 可靠性分析研究的一般原则: 复杂度高的/技术不成熟的/环境条件恶劣的/元器件(功率)比较多的部分可靠性指标分配应相对低一点; 重要度高的/维修可达性差的/标准化程度高的部分可靠性指标的分配相对高一点; 当以可靠性度R作为分配参数时,工作时间t较长部分,可靠度指标分配相对可低一点(因为R=e -t),7 可靠性指标的试验,基本MTBF(或失效率)的测试, 在实际工作过程中,很多时候并不需要精确在知道某个产品的MTBF,只需要知道是否可以接受此产品。这时,只需要对产品进行模拟运行测试,当产品通过了测试时,就认为产品达到了要求的MTBF,可以接受此产品。, 如何确定产品应该进行什么样的测试,也就是我们应该用多少样品进行多长时间的测试?根据MTBF(平均失效间隔时间)的定义,从“平均”这一个看来失效的次数越多计算值就越能代表“平均值”,当然失效次数越多对应的总测试时间也就越长;一般情况下要求:只要测试时间允许,失效的次数应应该取到尽可能多。,设备MTBF的快速估计(点估计值),T为台时数,即试验或工作的设备数设备工作(试验)时间,r为试验或工作中故障次数;当失效为0时,r=0.916 (60%置信度单边估计)r=2.3 (90%置信度单边估计)r=1.6 (80%置信度单边估计),例子,3台设备进行了200小时的试验,试验中失效6个,MTBF点估计为MTBF=(2003)/6=100h。 一批设备3台,交给客户使用,设备连续工作一年,无失效报告,则这批产品的MTBF为:MTBF(324 365 1)/0.916 =28690h,14600h11426h,元器件失效率的估计,T为元件小时,即试验或工作的元器件数 元器件工作(试验)时间,r为试验或工作中故障次数;当失效为0时,r=0.916 (60%置信度单边估计)r=2.3 (90%置信度单边估计)r=1.6 (80%置信度单边估计),例子,458个样品进行了2000小时的失效率鉴定试验,试验中失效6个,失效率为 =6/(2000458)=6.55 10-6/h 一批元器件300个,交给客户后装机使用,设备连续工作一年,无失效报告,则这批产品的失效率为:0.916/(30024365)=3.48510-7/h,有置信度要求的指标测定计算,例1, 某种产品,要求在90%的置信度下MTBF(或1/)为2000H,如何判定此产品的可靠性是否达到了规定的要求? 可以转化为判定此产品是否能通过规定时间的模拟运行测试,其关键是要找出测试时间:, 测试时间=AMTBF=A/,A这个因子与“在这段时间内允许失效的次数”和“90%的置信度”有关系。根据已经成熟的体系,直接代用公式:, X2(1-a,2(r+1) )是自由度为2(r+1)的X平方分布的a分位数;1-a是要求的置信度,为90%;r是允许的失效数,由你自己决定;, 此分布值可以通过EXCEL来计算,在EXCEL中对应的函数为CHIINV; 如允许失效1次时, A=0.5*CHIINV(1-0.9,2*2)=0.5*CHIINV(0.1,4)=0.5*7.78=3.89; 所以应该测试的时间为:3.892000=7780H。 也就是当设备运行7780H是只出现一次失效就认为此产品达到了要求的可靠性。,7780H是324天(7780/24=324),快一年了,做一次测试花一年的时间?太长!可和这样去调整:增加测试的总样品数;7780从统计上看,准确地说是7780台时、它是“机台时间”这样一个量;如果测试中有50台样机,则只需要测试155.6H;如果有100台样机,则只需要测试到77.8H;减少允许失效的次数;允许失效的次数为0时,同上计算后得到测试时间为4605台时(一般不建议采用此种方式来缩短测试时间,这样会增大测试的误差率,风险大)。 对于价格较低、数量较多的产品(如各种元器件、各种家用电器等),用上面介绍的方法,可以很方便地进行测试;但当产品的价格较高、MTBF较高的产品如何测试?一般是采用加速寿命试验方法(另讲)。,补充 应力加速寿命的计算,应力加速模型,3.4.1 加速寿命的基本原理和理论依据, 阿伦尼斯(Arrhenius)方程。1899年阿伦尼斯根据试验结果总结出化学反应率与温度间关系的经验公式,将元器件寿命变为产品寿命t,则可得,式中,t为产品的寿命当产品寿命服从对数正态分布时,t 一般指产品的中位寿命和t0.5;当产品寿命服从威布尔分布时,t一般指特征寿命);T为加速应力(温度)。, 式(3-3)就是由阿伦尼斯方程导出的加速寿命方程,它给出了产品t与加速应力(温度T)之间的关系,与之对应原曲线便是加速寿命曲线。显然,在单对数坐标系上,式(3-3)表示t与1/T是一条直线关系.反之,如果根据某产品的加速寿命试验数据,在单边对数坐标纸上描点,所得的轨迹可用直线拟合,那么该产品的寿命与温度满足关系式(3-3).更进一步,在拟合直线延长线上可以得到正常应力(温度)水平下的寿命数据., 逆幂律方程。有些产品的寿命与所加电压U或所通电流I这间符合逆幂律关系。其关系式为:, 式中,Pr为基准应力(额定应力);P为工作应力;r为在应力Pr下的寿命;为在应力P下的寿命;为幂指数,高温高热加速, 根据加速模型(Arrhenius Mode),得知加速因子的表达式为:, Ea为激活能(eV),k为玻尔兹曼常温且k=8.6*10E-5eV/K。T为绝对温度、RH指相对温度(单位%)、下标u指常态、下标s指加速状态(如RHun指常态下相对温度的n次方),一般情况下n取2。,例, 某种产品,要求在90%的置信度下MTBF为20000H,因单价较贵,只能提供10台左右的产品做测试,请问如何判定此产品可靠性是否达到规定的要求? 还是转化为测试。即使有10台产品全部用于测试,20000H的MTBF也需要测7780H左右,这个时间太长,应该怎么办?, 根据加速模型(Arrhenius Model),得知加速因子的表达式为:, Ea为激活能(eV),k为玻尔兹曼常温且k=8.6*10E-5eV/K。T为绝对温度、RH指相对温度(单位%)、下标u指常态、下标s指加速状态(如RHun指常态下相对温度的n次方),一般情况下n取2。, Ea根据原材料的不同,有不同的取值,一般情况下: 氧化膜破坏 0.3Ev 离子性(SiO2中Na离子漂移) 1.0-1.4Ev 离子性(Si-SiO2界面的慢陷阱) 1.0eV 由于电迁移而断线 0.6eV 铝腐蚀 0.60.9eV 金属间化合物生长 0.50.7eV 根据产品的特性,取Ea为0.6eV,则在75、85%RH下做测试1h,相当于在室温(25、75%RH)的加速倍数为:,F=EXP(0.6*(1/298)-(1/348)*105/8.6+(0.852-0.752)=34 若允许一次失效,在90%的置信度下,需要测试的时间为:Ttest=A*MTBF,A的计算同上用EXCEL计算, 即:A=0.5*CHIINV(1-0.9,2*2)=0.5*CHIINV(0.1,4)=0.5*7.78=3.89 所以要求的室温下的测试时间为:Tu=3.89*20000=77800H;换算后,在高温下的测试时间为:Ta=778000/AF=2288Hrs; 最后,测试方案就是:将10台设备在75、85%下进行228.8Hrs的测试,如果失效次数小于或等于一次,就认为此产品的MTBF达到要求。,3.4.2不知道Ea, 实际工作中,没有那么多样品,只能用最少的样品数:9台(每个温度下各三台)。具体做法是: a、取三台设备在高温T下运行,观察产品的失效情况。若产品较快失效,则取t1=T,t2=t1-15,(1/t3)-(1/t1)=2(1-t2)-(1-t1);若产品长时间没有失效,则取t3=1,t2=t3+15,(1/t3)-(1/t1)=2(1/t2)-(1/t1). b、根据三个温度点对应的产品寿命时间,计算出此产品的Ea。 上面的方法对元器件都比较适用,对一些系统,可能就不太合适了。,例1, 某产品进行了4个温度点的加速寿命试验,其数据如下,试计算在25时的MTBF(用点估计即可),X为1/T,y为 ln(),在EXCEL中作图,将对应的曲线用直线拟合、显示公式得到直线的斜率为9530.5;也就是(Ea/k)=9530.5,故Ea=0.821eV故产品在常温25时寿命为 Ln()=-22.546+9530.5(1/298)=9.436=MTBF=12525.77故产品失效率为:=7.9810-5/h,(k=1.380662E-23J/K,1eV=1.602189E-19),第二篇、电子设备可靠性预计,1.1 可靠性预计的目的, 可靠性预计是电子设备可靠性从定性考虑转入定量分析的关键是“设计未来”的先导,是决策设计、改进设计,确保产品满足可靠性指标要求的不可缺少的技术手段。 可靠性预计不去追求绝对准确。采用统一尺度预计,为可靠性的定量分析提供可比的相对度量。 预计的主要目的在于检查产品研制方案和电路设计的合理性,比较不同设计方案的可靠性水平,发现薄弱环节,对高故障率和随过高应力部分引起注意。 与可靠性分配技术相结合,把规定的可靠性指标倒塌地分配给各个组成部分,并为制定研制计划、验证试验方案以及维修、后勤保障方案提供依据。,1.2 可靠性预计的作用, 在设备、系统的设计阶段,定量地预测其可靠性水平,以判断设计方案能否满足可靠性指标的要求。 对几种相似的设计方案进行比较,以便选择在可靠性、性能、重量、费用等方面最佳的综合设计方案。为实施可靠性分配提供依据。 为实施可靠性根本提供依据。 为优选元器件及合理使用元器件提供指南。 通过应力分析法预计,可鉴别设计上潜在的问题,以便于及时地采取措施来改进设计,以便制定设备、系统的预防性维护方案。 中立机构进行可靠性预计,预测产品的寿命,增强产品的竞争力。,1.3 可靠性预计的常用的标准,可靠性预计的主要依据,1)工作状态预计依据 GJB/Z 299C-98应力分析法、元器件计数法 MIL-HDBK-217F Notice2应力分析法、元器件计 数法 NPRD95(非电) SR-3322)非工作状态预计依据 GJB/Z 108-98应力分析法、元器件计数法 NPRD95(非电),元器件计数法预计, 元器件计数法是在初步设计阶段使用的预计方法。在这个阶段中,每种通用元器件的数量已经基本上确定,在以后的研制和生产阶段,整个设计的复杂度预期不会有明显的变化。元器件计数法假设元器件失效前的时间是指数分布的(即元器件失效率恒定)。 如果产品可靠性模型的所有部分为串联的,或者为取得近似值可以假设它们是串联的,则可以把元器件失效率相加直接求得产品故障率。,元器件计数法预计所需信息,a、设备上手忙脚乱元器件的种类及每类元器件的数量;种类的划分是按GJB/Z 288B上18大类元器件中的小类。b、各种类元器件的质量等级及其质量系数。c、设备应用的环境类别。比如,设备是用在导弹发射场合呢,还是用在背负、手提环境,等等。,2 元器件计数法预计计算步骤, 先计算设备中的各种类型(按所采用的预计手册分类)元器件的数目; 不同质量等级的元器件数目; 然后再乘上相应元器件在规定使用环境下的通用失效率; 最后把各类元器件的失效率累加起来,即可得到部件、系统的故障率(参见例子P9),3 元器件的应力分析法概述, 元器件应力分析法通过分析设备上各元器件工作时承受的电、热应力及了解元器件的质量等级,承受电、热应力的额定值,工艺结构参数和应用环境等,计算各元器件的工作失效率,并由产品可靠性模型预计电子设备和系统的可靠性指标。 元器件应力分析法适用于详细设计阶段,在这个阶段,所使用的元器件规格、数量,工作应力和环境条件、质量等级等应该是已知的,或者根据硬件定义能够确定。 在实际或模拟使用条件下进行可靠性评价之前,应力分析法是最能反映实际可靠性的一种可靠性预计方法。 应力分析法假设元器件失效前时间服从指数分布(即失效率恒定)。,元器件的应力分析法预计程序,元器件失效率模型, 普通晶体管的工作失效率模型为: p= bE Q A S2 r C 式中: p工作失效率; b 基本失效率; E 环境系数; Q 质量系数,其对应的质量等级见表; A 应用系数; S2 电压应力系统; r 额定功率或额定电流系数; C 结构系数。,应用环境类别与环境系数E, 不同环境下,电子设备所经受的冲击、振动等机械环境应力和气候环境应力有很大差别。根据电子设备的应用场合,环境应力和类型,及其对电子产品可靠性的影响程度,GJB/Z299C规定了18类应用环境。 电子设备及元器件处于不同类别的环境中其可靠性则不相同。手册中以环境系数E表示不同环境类别的环境应力对元器件失效率的影响程度。亦即, E值表示该环境相对于基准环境的严酷倍数。 因此 ,GJB/Z229B分别列有环境系数表,提供了各种类元器件的环境系数值。,元器件质量等级与质量系数, 元器件质量直接影响其失效率,不同质量等级对元器件失效的影响程度用质量系数Q来表示。所谓质量等级是指元器件装机使用之前,在制造检验及筛选过程中其质量的控制等级。质量系数则反映了不同质量等级的元器件其失效率的差异程度。 根据我国电子元器件标准的制订实施情况及按不同标准或技术文件组织街道和试验的产品的实际可靠性水平,手册中将各类元器件划分为A、B、C三个质量层次。每个层次包含若干个质量等级,每个质量等级分别给出与其对应的质量系数值。(见GJB299),晶体管失效率计算示例, 设有一符合GJB33-85半导体分立器件总规范JP级的硅NPN单管在恶劣地面固定设备的线性电路中使用,实际功耗是额定功耗(0.7W)的0.4倍,工作环境温度为40,Ts=25,TM=175,外加电压VCE是额定电压VCEO的60%,其工作失效率可用下式计算。, p=E Q A S2 r T C b 其应力比为S=0.4,环境温度为40, 基本失效率b=0.205(10-6)h。 GP级的质量系数Q =0.1. 恶劣地面固定的环境系数E =5。 电压应力系数S2 =0.88 应用系数A =1,(若开关状态, A =0.7) 额定功率或额定电流系数r =1 种类(结构)系数C =1 温度应力系数,本例不用此参数,取T =1 p=E Q A S2 r T C b =0.2055 0.1 1 1 0.88 1 1 =0.090,4.5贝尔实验室(Bellcore)TR332可靠性预计,元器件恒定失效率预计结合试验数据的修正预计法结合现场数据预计法.,4.5.1 元器件恒定失效率预计,适用情形: 情形1单元/系统老炼时间1小时,元器件未以过老炼油的黑盒子选件,假定工作渐度和电应力为40和50%; 情形2单元/系统老炼时间1小时,元器件未经过老炼的黑盒子选件,假定工作温度和电应力为40和50%; 情形3一般情况。,元器件计数法,元器件计数法(续),4.1.1基本恒定失效率预计(适用于情形3) ssi=GiQi Si Ti式中: Gi第i个元器件的稳定状态的失效率 Qi第i个元器件的质量系数 Si 第i个元器件的电应力系数 Ti 第i个元器件稳定状态下,正常工作温度的温度应力系数;应力系数:对于 情形1和情形2,公式简化为: SSi=CiQi,单元的恒定状态失效率,式中:n单元中的不同器件类型数量;Ni第i类元器件的数量i单元的环境系数,4.1.2 等效时间计算,器件的等效工作时间 为了计算第i类器件的首年因子,有必要按元器件的有效老练时间计算出等效的工作时间tei.,该公式适用于情形3,式中:Ab,d相应于器件老炼温度的阿伦尼斯系数;tb,d器件的老炼时间(小时)Ab,u相应于单元老炼温度的阿伦尼斯系数Tb,u单元的老炼时间(小时)Ab,s相应于系统老炼温度的阿伦尼斯系数tb,s系统的老炼时间(小时)Aop相应于正常工作温度的温度加速系数系数si相应于正常工作条件的电应力系数情形2:tei=Ab,utb,u+Ab,stb,s;情形1:tei=1,4.1.3 首年因子计算FYi,情形3,元器件/单元/系统老炼时间1小时,元器件的首年因子FYi 情形3,元器件/单元/系统老炼时间1小时,如果100008760Ti Si,那么FYi=4/(Ti Si)0.75否则, FYi=1+3/( Ti Si)情形2, Ti = Si=1.0如果0tei10000,那么FYi的值查Bellcore手册表11-9如果tei10000,那么FYi=4=1情形1, FYi=4.0,单元的首年因子FYi用下面的公式加权平均元器件的首年因子,获得单元的首年因子。,产品研制中可靠性预计的应用,可靠性预计时应注意的事项, GJB/229B白日做匠元器件失效率数据仅适用于额定值范围,任何外推都无效。 用应力分析法得到的元器件失效率数据的准确性,取决于对元器件承受电、热等应力的准确分析。其中,元器件工作环境温度是指外壳或微环境温度,并非整机所受到的环境温度。一般元器件工作温度都比整机环境温度高。 如产品可能遇到多种使用环境时,原则上应分别进行可靠性预计。 元器件质量系数Q的取值是依据产品标准、技术要求和工程经验,因此,应按规范采购、验收和使用元器件。,参考书:电子产品可靠性预计科学出版社,第三篇 失效模式,影响及危害性分析(FMEA),中国赛宝,126,可编辑,内容介绍,1 概述 FMECA同FTA的概念、相互区别及应用2 FMECA的一般方法 FMEXA分析方法 FMECA分析实例3 FTA的方法基础4 FTA的一般方法 FT的建立和简化、FT的定量分析、定性分析,FMEA、FMECA, 失效模式、影响与危害分析(FMECA),或失效模式与效应分析(FMEA),是一种可靠性分析技术,在工程设计)可以是整个的也可以是局部的)完成后供检查和分析设计图纸(就电子设备来说,是对电路的设计图纸)用。 这种分析方法能对被研究对象具体指明单元可能发生的失效模式(例如,对电路来说,是发生开路失效或短路失效,饱和阻塞,还是参数漂移等)、产生的效应和后果,因而有助于获得供改进可靠性用的具体工程方案。, FMECA是在FMEA基础上扩展出来的,它是FMA(故障模式分析)、FEA(失效影响分析)、FCA(失效后果分析)三种方法的总称。它使定性分析的FMEA增加了定量分析的特点。 失效模式、效应与危害度分析又是维修性设计特别是故障安全设计的基础,也是PLP(产品责任预防)分析的代表性方法。 70年代末期,美国发生的几起重大事故均与未周密地进行失效模式、效应与危害度分析有关。例如:, NASA卫星系统,在发射情况下,由于对旋转天线汇流不进行失效模式、效应与危害分析时只考虑开路失效模式,忽略了短路失效效应,结果因天线汇流环发生短路而使发射失效,损失了九千至一亿五千万美元。 美国DC-10商用飞机在变更发动机维修方法时,因未进行失效模式、效应与危害度分析,终于在芝加哥上空坠毁。1979年3月28日,美国的三里岛2号反应堆发生的举世瞩目的重大安全事故,也是因未对控保系统中增压安全阀及其监示电路的失效模式进行详细分析的结果。,故障模式、效应与危害度分析(FMECA)的一般方法,应用FMECA的意义, 发射卫星的运载火箭,为安全飞行起见,均设有“自毁控制接收机”接收地面指挥系统必要时发出的自毁信号而引爆火箭本身。由于自毁引爆损失重大,因此设计则是通过失效模式、效应与危害度分析作出改进。,通过失效模式、效应及危害度分析可以做到, 鉴别出被分析单元会导致的不可接受或非常严重的失效,确定可能会对预期或所需运行情况造成致使影响的失效模式,并列出由此而引起的从属失效; 决定需另选的元器件、零部伯和整件; 保证能识别各种检测手段引起的失效模式; 选择预防或正确维护要点,制定故障检修指南,配置测试设备以及测试点提供资料。 确定单元及子系统失效模式的危害度,3.1 FMEA的分类(系统FMEA、设计FMEA和工艺FMEA),常用标准, 众多标准、规范和手册描述的FMEA主要分为军工标准和汽车行业标准或规范两大类,军工先进水平以MIL-STD-