可靠性是工业产品的重要设计指标和用户选择依据之一,衡量可靠性的指标和参数很多,包括:可靠度、失效概率、失效率、平均工作时间、平均维修时间、有效度等。而MTBF作为机械电气系统中常用的可靠性指标,通常被认为MTBF越长表示可靠性越高正确工作能力越强 。MTBF值是产品设计时要考虑的重要参数,可靠性工程师或设计师经常使用各种不同的方法与标准来估计产品的MTBF值。
Dalanik定律:”可修复的复杂产品,无论故障件寿命分布类型如何,故障件修复或更新以后,产品的故障率随时间而趋于常数。”
可靠性的定义是单独一套产品在规定条件下能够正常运行达到指定时长的概率。它可以采用统计数据表达如下:
R(t) = e-λt
其中,λ表示固有故障率,不包括初期故障(早期故障)和磨损故障(寿命终点)。因而可靠性是在下图所示常见故障率曲线的中央平直部分发生故障的概率。


λ的倒数1/λ给出了修复前平均时间(MTTF),这一概念更为常见的表述是平均故障间隔时间(MTBF),在电力行业尤其常用。
所有元件和系统的曲线形状都近似相同,只是时间轴方向上的延伸率不同。浴盆曲线”代表了产品寿命的三个主要阶段:
早期故障率阶段:此阶段的特点是初始故障率相对较高,然后迅速下降。此特性并非在所有产品中都表现显著。此阶段的故障率通常按“每百万缺陷数” (dppm) 进行衡量。
稳定状态阶段:此阶段具有相对恒定的故障率,在器件的使用寿命期间保持稳定。按“FIT”单位或“故障间隔平均时间”(MTBF) 小时数描述此故障率。
损耗阶段:此阶段代表内在损耗机制开始居主导地位的点,故障率开始呈指数上升。产品寿命通常定义为从初始生产至损耗开始的时间。
MTBF,即平均故障间隔时间,英文全称是“Mean Time Between Failure”,是从新的产品在规定的工作环境条件下开始工作到出现第一个故障的时间的平均值。MTBF越长表示可靠性越高正确工作能力越强 。单位为“小时”。反映了产品的时间质量,是体现产品在规定时间内保持功能的一种能力。
具体来说,是指相邻两次故障之间的平均工作时间,也称为平均故障间隔。它仅适用于可维修产品。同时也规定产品在总的使用阶段累计工作时间与故障次数的比值为MTBF。磁盘阵列产品一般MTBF不能低于50000小时。
目前,使用最为广泛的三个衡量可靠性的参数是:MTTF(mean time to failure, 平均失效前时间),定义为随机变量、出错时间等的”期望值”。但是,MTTF经常被错误地理解为,”能保证的最短的生命周期”。MTTF的长短,通常与使用周期中的产品有关,其中不包括老化失效。
MTTR (mean time to restoration. 平均恢复前时间)。源自IEC61508中的平均维护时间 (mean time to repair)目的是为了清楚界定术语中的时间的概念,MTTR是随机变量恢复时间得期望值。它包括确认失效发生所必需的时间,以及维护所需要的时间。MTTR也必须包含获得配件的时间,维修团队的响应时间,记录所有任务的时间,还有格设备重新设入使用的时间。
MTBF 平均故障间隔时间为失效或维护中的时间。对于一个简单的可维护的元件,MTBF = MTTF + MTTR。 因为MTTR通常远小于MTTF,所以MTBF近似等于MTTF,通常由MTTF替代。
设想一个元器件的固有故障率(λ)为10-6次故障/小时。尽管MTBF为100万小时,但R(t) = e-λt曲线(如下图所示)统计表明只有36.7%的装置有可能运行这么久。60.6%的装置预计能够运行500,000小时,而可以进一步预计有90.5%的装置寿命能够持续100,000小时。

得出各元器件的这个信息之后,必须将构成系统的所有元器件各自的故障率相加,从而了解整个产品能够持续运转的时间(λA = λ1n1 + λ2n2 + … + λini)。显然,系统的可靠性可能不如其中最不可靠的元器件。对于设计者而言,着重优化较薄弱的元器件会带来收益。从中得出的重要信息是,MTBF虽然是分析和比较产品和元器件的可靠依据,但不应被当作预期寿命的直接表述。
在单位时间内(一般以年为单位),产品的故障总数与运行的产品总量之比叫“故障率”(Failure rate),常用λ表示。例如网上运行了100 台某设备,一年之内出了2次故障,则该设备的故障率为0.02次/年。当产品的寿命服从指数分布时,其故障率的倒数就叫做平均故障间隔时间。即:MTBF=1/λ。
例如,某型号YY产品的MTBF时间高达16万小时。16万小时约为18年,并不是说YY产品每台均能工作18年不出故障。由MTBF=1/λ可知,λ=1/MTBF=1/18年(假如YY产品的寿命服从指数分布),即YY产品平均年故障率约为5.5%,一年内,平均1000台设备有55台会出故障。
整机可靠性指标用平均故障间隔时间表示:
MTBF=(T1+T2+…Tn)/ rn
式中:MTBF——整机的平均故障间隔时间,h;
Ti——第i台被试整机的累计工作时间,h;
rn——被试整机在试验期间内出现的故障总数。
串并联部件所导致的MTBF不同 λ=1/MTBF(h)
如果两个部件串联工作,其中一个发生失效,整个功能就失效了,串联结构的:
λ总=λ1+λ2或MTBF总=1/(λ1+λ2)
对于并联或冗余的结构,虽然一个部件失效,但仍然维持功能的完整性(100%);
1/λ总=(1/λ1)+(1/λ2)+(1/(λ1+λ2))或 MTBF总=(λ21 + λ1λ2 +λ22)/(λ21λ2 +λ1λ22)
一般产品的MTBF计算
平均失效(故障)前时间(MTTF)
设N0个不可修复的产品在同样条件下进行试验,测得其全部失效时间为T1,T2,……TN0。其平均失效前时间(MTTF)为:MTTF = (T1+T2+…Tn)/N0
由于对不可修复的产品,失效时间即是产品的寿命,故MTTF也即为平均寿命。
当产品的寿命服从指数分布时,MTTF=1/λ
平均故障间隔时间(MTBF)
一个可修复产品在使用过程中发生了N0次故障,每次故障修复后又重新投入使用,测得其每次工作持续时间为T1,T2,……TN0,其平均故障间隔时间MTBF为:MTBF=T/N0
其中,T为产品总的工作时间。
对于完全修复的产品,因修复后的状态与新产品一样,一个产品发生了N0次故障相当于N0个新产品工作到首次故障。因此:MTBF=MTTF。
当产品的寿命服从指数分布时,产品的故障率为常数λ,则MTBF=MTTF=1/λ。
平均修复时间(MTTR)
其观测值是修复时间t的总和与修复次数之比:MTTR=(T1+T2+…Tn)/n
式中:ti——第i次修复时间;n——修复次数。
MTBF计算公式(通过温度系数):
MTBF = Total Test Time*Acceleration Factor/Coefficient (refer to the table)
AF:Accelerate Factor,加速因子
T:Total Power on Time,总的开机运行时间
X2(α,2r+2):卡方公式
C:Confidential Level,信心度水平
α:生产者的冒险率,即:1-C
r:失效数,Number of Failures
加速因子AF :
加速因子即为产品在正常使用条件下的寿命和高测试应力条件下的寿命的比值。
如果温度是产品唯一的加速因素,一般采用Arrhenius Model(阿氏模型)。当产品寿命适用于阿氏模型,则其加速因子公式为:AF=e{ Ea/Kb*[1/Tn-1/Ta]}。
Ea:活化能,单位eV
Kb:Boltzmann Constant波茲曼常数,(0.00008623eV/°k)
Tn:正常操作条件绝对温度(°k)
Ta:加速寿命试验条件绝对温度(°k)
活化能Ea定义:
是分子与化学或物理作用中需具备的能量,单位为eV (electron-Volts)。用以超越阻隔潜在故障与实际失效所需的能量。
活化能高,表示对温度变化影响比较显著。当试验的温度与使用温度差距范围不大时,Ea可设为常数。
一般电子产品在早夭期失效的Ea为0.2~0.6eV,正常有用期失效的Ea趋近于1.0eV;衰老期失效的Ea大于1.0eV。
根据Compaq可靠度工程部(CRE)的测试规范,Ea是机台所有零件Ea的平均值。如果新机种的Ea无法计算,可以将Ea设为0.67eV,做常数处理。
随着以可靠性为中心的维修理论的发展,经过大量的研究,对于复杂产品故障,除了浴盆曲线故障模型外,还存在其他五种故障模型。

五种故障曲线显示各种机电部件故障与时间的关系,其中故障概率呈稳定或缓慢上升D、E、F三种类型占了故障总概率的89%,其余的只占11%。
复杂产品的故障模式多种多样,每种故障随机发生后,如果及时排除、修复或更新故障件,可使产品故障率成为常数。除了简单的磨损、疲劳及腐蚀等消耗故障外,才属于A、B、C类型故障。
根据不同的故障分布曲线,产品越复杂,故障率越高,随机性越大。只按某种固定监测诊断方法和维修方式,难以解决复杂的产品故障问题。
美国宇航局NASA通过研究,归纳六种TPM产品故障概率,其中F类占68%,在整个服役期内故障概率恒定。
所谓复杂的产品是指具有多种故障模式的产品,一般的机械产品、电气和电子产品大多为复杂的产品,如电机、汽轮机、加工中心、压缩机及生产线等。这些产品的故障基本符合F类故障规律,在服役期间故障率恒定不变,但是其故障是随机发生的。
所以要强调对产品的监测和诊断,产品故障的随机性越强,越要进行检测和诊断。TPM产品检测诊断有产品停机检测诊断和运行中的检测诊断;也有在线监测诊断和离线监测诊断。
产品性能存在一个由开始劣化并进入潜在故障期的渐变过程,称产品从潜在故障到功能故障的间隔期为P-F间隔,如图所示。
