MTBF
目錄
1.MTBF概述
MTBF,平均故障間隔時間又稱平均無故障時間,英文全稱是“Mean Time Between Failure”指可修復(fù)產(chǎn)品兩次相鄰故障之間的平均時間,記為MTBF。MTBF是衡量一個產(chǎn)品(尤其是電器產(chǎn)品)的可靠性指標(biāo)。單位為“小時”。它反映了產(chǎn)品的時間質(zhì)量,是體現(xiàn)產(chǎn)品在規(guī)定時間內(nèi)保持功能的一種能力。具體來說,它僅適用于可維修產(chǎn)品。同時也規(guī)定產(chǎn)品在總的使用階段累計工作時間與故障次數(shù)的比值為MTBF。磁盤陣列產(chǎn)品一般MTBF不能低于50000小時。
隨著伺服器的廣泛應(yīng)用,對伺服器的可靠性提出了更高的要求。所謂“可靠性”,就是產(chǎn)品在規(guī)定條件下和規(guī)定時間內(nèi)完成規(guī)定功能的能力;反之,產(chǎn)品或其一部分不能或?qū)⒉荒芡瓿梢?guī)定的功能是出故障。概括地說,產(chǎn)品故障少的就是可靠性高,產(chǎn)品的故障總數(shù)與壽命單位總數(shù)之比叫“故障率”(Failure rate),常用λ表示。例如正在運行中的100只硬碟,一年之內(nèi)出了2次故障,則每個硬碟的故障率為0.02次/年。當(dāng)產(chǎn)品的壽命服從指數(shù)分布時,其故障率的倒數(shù)就叫做平均故障間隔時間(Mean Time Between Failures),簡稱MTBF。
2.MTBF的計算
設(shè)有一個可修復(fù)的產(chǎn)品在使用過程中,共計發(fā)生過N0次故障,每次故障后經(jīng)過修復(fù)又和新的一樣繼續(xù)投入使用,其工作時間分別為:,那么產(chǎn)品的平均故障間隔時間,也就是平均壽命為Q為:
通常,我們在產(chǎn)品的手冊或包裝上能夠看到這個MTBF值,如8000小時,2萬小時,那么,MTBF的數(shù)值是怎樣算出來的呢,假設(shè)一臺電腦的MTBF 為3萬小時,是不是把這臺電腦連續(xù)運行3萬小時檢測出來的呢?答案是否定的,如果是那樣的話,我們有那么多產(chǎn)品要用幾十年都檢測不完的。其實,關(guān)于 MTBF值的計算方法,目前最通用的權(quán)威性標(biāo)準(zhǔn)是MIL-HDBK-217、GJB/Z299B和Bellcore,分別用于軍工產(chǎn)品和民用產(chǎn)品。其中,MIL-HDBK-217是由美國國防部可靠性分析中心及Rome實驗室提出并成為行業(yè)標(biāo)準(zhǔn),專門用于軍工產(chǎn)品MTBF值計算,GJB/Z299B是我國軍用標(biāo)準(zhǔn);而Bellcore是由AT&TBell實驗室提出并成為商用電子產(chǎn)品MTBF值計算的行業(yè)標(biāo)準(zhǔn)。
MTBF計算中主要考慮的是產(chǎn)品中每個器件的失效率。但由于器件在不同的環(huán)境、不同的使用條件下其失效率會有很大的區(qū)別,例如,同一產(chǎn)品在不同的環(huán)境下,如在實驗室和海洋平臺上,其可靠性值肯定是不同的;又如一個額定電壓為16V的電容在實際電壓為25V和5V下的失效率肯定是不同的。所以,在計算可靠性指標(biāo)時,必須考慮上述多種因素。所有上述這些因素,幾乎無法通過人工進行計算,但借助于軟件如MTBFcal軟件和其龐大的參數(shù)庫,我們就能夠輕松的得出MTBF值。
3.MTTF、MTBF和MTTR的區(qū)別
可靠性是最初是確定一個系統(tǒng)在一個特定的運行時間內(nèi)有效運行的概率的一個標(biāo)準(zhǔn)??煽啃缘暮饬啃枰到y(tǒng)在某段時間內(nèi)保持正常的運行。
目前,使用最為廣泛的一個衡量可靠性的參數(shù)是,MTTF(mean time to failure,平均失效前時間),定義為隨機變量、出錯時間等的"期望值"。但是,MTTF經(jīng)常被錯誤地理解為,"能保證的最短的生命周期"。MTTF 的長短,通常與使用周期中的產(chǎn)品有關(guān),其中不包括老化失效。
MTTR(mean time to restoration,平均恢復(fù)前時間),源自于IEC 61508中的平均維護時間(mean time to repair),目的是為了清楚界定術(shù)語中的時間的概念,MTTR是隨機變量恢復(fù)時間得期望值。它包括確認(rèn)失效發(fā)生所必需的時間,以及維護所需要的時間。 MTTR也必須包含獲得配件的時間,維修團隊的響應(yīng)時間,記錄所有任務(wù)的時間,還有將設(shè)備重新投入使用的時間。
MTBF(Mean time between failures,平均故障間隔時間)定義為,失效或維護中所需要的平均時間,包括故障時間以及檢測和維護設(shè)備的時間。對于一個簡單的可維護的元件,MTBF = MTTF + MTTR。因為MTTR通常遠(yuǎn)小于MTTF,所以MTBF近似等于MTTF,通常由MTTF替代。MTBF用于可維護性和不可維護的系統(tǒng)。
4.MTBF分析的目的[1]
1)針對高頻率故障零件的重點對策及零件壽命延長的技術(shù)改造依據(jù)。
2)進行零件壽命周期的推算及最佳維修計劃編制。
3)有關(guān)點檢對象、項目的選擇與點檢基準(zhǔn)的設(shè)定、改善。
4)用于指導(dǎo)內(nèi)外部維修工作分配。根據(jù)公司內(nèi)設(shè)備修復(fù)能力的評價,以設(shè)備類型、作業(yè)種類的不同來決定內(nèi)部分別承擔(dān)工作的維修質(zhì)量與設(shè)備效率方面的風(fēng)險,作為維修外包的重要參考。
5)設(shè)定備品備件基準(zhǔn)。機械、電氣零件的各儲備項目及基本庫存數(shù)量,應(yīng)根據(jù)MTBF的記錄分析來判斷,使其庫存水平達(dá)到最經(jīng)濟的狀況。
6)作為選擇維修技術(shù)方法改善重點的參考依據(jù)。為了提高設(shè)備開動率,必須縮短與設(shè)備停機相關(guān)的長時間維修作業(yè)及工程調(diào)整、切換的時間。因此,有必要對維護作業(yè)方法進行檢驗,而其檢驗的項目、優(yōu)先順序的選擇等基本情況,均需要依據(jù)MTBF的分析記錄表。
7)用于設(shè)備對象設(shè)定預(yù)估運行時間標(biāo)準(zhǔn),及其維護作業(yè)的選定與維護時間標(biāo)準(zhǔn)的研究。維修計劃預(yù)估時間標(biāo)準(zhǔn)的設(shè)定及維護作業(yè)的選定,必須考慮設(shè)備維護重復(fù)周期或標(biāo)準(zhǔn)時間值與實際維護時間的差異及相應(yīng)維護作業(yè)特性等因素,因此,MTBF分析表是非常必要的。
8)圖樣整理及重新選定重點設(shè)備或零件時的參考。MTBF的分析記錄表所記錄的設(shè)備零件改造項目或摩擦劣化等信息,以及設(shè)備圖樣修改或前期制作等情況,通過能經(jīng)常作分析檢驗及重要性排序管理,可以使工程圖樣管理變得更容易。
9)運行操作標(biāo)準(zhǔn)的設(shè)定、修訂及決定設(shè)備維護業(yè)務(wù)的責(zé)任分派。
10)提供設(shè)備的可靠性、可維修性設(shè)計的技術(shù)資料。維護技術(shù)最重要的是以MTBF分析表為基礎(chǔ),收集有關(guān)設(shè)備的可靠性、可維修性設(shè)計的技術(shù)信息,以便提供給設(shè)計部門在設(shè)計設(shè)備時參考。
5.MTBF分析的應(yīng)用[1]
1)對于維修部門而言,很難了解維修活動與產(chǎn)品質(zhì)量間的關(guān)系。例如,就故障修理而言,一般多以功能修理為重點,不會去確認(rèn)維修作業(yè)所達(dá)到的產(chǎn)品質(zhì)量改善的情況。但如何將產(chǎn)品質(zhì)量和維修活動相結(jié)合,是非常重要的,MTBF分析表可作為重要的參考資料。
2)PM(生產(chǎn)維修)是著重以設(shè)備診斷技術(shù)為中心的預(yù)知維修,但其具體課題結(jié)果是很難把握的;從MTBF分析表中,找出設(shè)備診斷技術(shù)開發(fā)的課題,是一種很有效果的做法。
3)設(shè)備培訓(xùn)資料的制作:培養(yǎng)對設(shè)備熟悉、能力強的人員是PM的重要課題,然而一般培訓(xùn)多以市面上銷售書籍為范本,并沒有充分結(jié)合自己公司、單位的問題狀況,與書本上所述的背景問更存在著差異。因此,如果能利用MTBF分析,培訓(xùn)有關(guān)公司生產(chǎn)設(shè)備的結(jié)構(gòu)、功能、薄弱環(huán)節(jié)及注意事項,是較具體的做法。
4)關(guān)于設(shè)備壽命周期費用(LifeCycleCost,LCC)的把握及其研究資料:MTBF分析表,是以設(shè)備為主體,經(jīng)長期而編制的一覽表。因此,根據(jù)設(shè)備所發(fā)生的維修作業(yè)、費用、備品備件及損失的發(fā)生狀況,來掌握設(shè)備壽命周期費用資料,是設(shè)備一生管理的重要基礎(chǔ)。綜上所述,MTBF分析不僅是維修記錄的方法之一,其維修記錄更可作為維護活動、管理和技術(shù)活動指南的原始資料,價值和意義重大。
6.制作MTBF分析表的注意事項[1]
1)應(yīng)具備一覽性,盡可能將相關(guān)資料整理在一張表上,不要散亂。
2)將一特定期間內(nèi)的維修數(shù)據(jù)及相關(guān)資料,按照時間序列進行整理、記錄,以便于了解。
3)可同時進行維修的記錄和分析。
4)多花點心思,在一張表內(nèi)整理多種信息:不僅可以將設(shè)備故障或維修資料記錄下來,還可將質(zhì)量、安全、成本等信息整理成與制造、設(shè)計、技術(shù)相關(guān)的參考資料。
5)通過MTBF分析表即可了解設(shè)備管理的重點。
6)通過MTBF分析表可判斷故障和維護的關(guān)系。
7)了解改善對策及對策實施后的效果。
8)應(yīng)使任何人都可容易進行資料的記錄。例如在一年設(shè)備開動期間曾發(fā)生4次故障,則平均故障間隔時間為3個月。以【圖1】為例,可以推算出每3個月將會發(fā)生一次故障。另外,也可依照這些故障點的分布狀況,推斷下次可能發(fā)生故障的設(shè)備部位及零件。
7.MTBF分析表制作的五個步驟[1]
步驟1:確定要分析的設(shè)備對象——通常先選擇重點設(shè)備來記錄,也可以按某類設(shè)備群或針對設(shè)備某重點部位進行記錄。
步驟2:故障資料的收集——以過去3~5年或至少30次以上的設(shè)備故障資料來分析。
步驟3:故障分布圖的繪制——將設(shè)備整體示意圖繪出,利用步驟2的資料,標(biāo)示出故障部位,如【圖2】所示。
步驟4:編制MTBF分析表(如【圖3】所示)。
·分析表的內(nèi)容以能記入一年的資料為準(zhǔn)。
·將步驟3的內(nèi)容,按部位類別、發(fā)生日期順序記錄。
·盡可能用圖形方式或顏色類別、記號記錄,以增加易讀性。
·持續(xù)記錄到“設(shè)備突發(fā)故障為零時”為止。
步驟5:故障分析及對策的檢驗。
·由MTBF分析表來做故障原因分析及對策檢驗(常用的分析方法包括柏拉圖、特征要因圖(魚骨圖)和故障樹法等,如【圖4】所示)。
·對策方法應(yīng)采用易懂的方式,并切實可行。
8.MTBF的案例分析
案例一:MTBF分布模型的案例分析[2]
考核機電產(chǎn)品的可靠性水平通常用平均故障間隔時間(MTBF)來衡量,即:考核產(chǎn)品在規(guī)定條件下和規(guī)定時間內(nèi),完成規(guī)定功能的能力。根據(jù)考核結(jié)果(MTBF)的值,判斷該產(chǎn)品目前在國內(nèi)外同類產(chǎn)品中所處地位,對于可靠性水平較低的產(chǎn)品,提出相應(yīng)改進措施,切實提高產(chǎn)品可靠性。歸根結(jié)底要對MTBF進行分析。
下面以某數(shù)控機床廠生產(chǎn)的系列加工中心為例,通過對采用定時截尾的方法對6臺同系列不同編號的加工中心現(xiàn)場使用情況所收集的共30條數(shù)據(jù)進行分析,根據(jù)故障觀測值的分布形狀來擬合已知線形,應(yīng)用數(shù)理統(tǒng)計中的參數(shù)估計、假設(shè)檢驗等方法進行驗證,從而判斷出故障間隔時間的分布模型,為進行故障分析、預(yù)測及實現(xiàn)可靠性增長提供了理論依據(jù)。
1 故障間隔時間分布模型的初步判斷
1. 1 概率密度的觀測值
下面由該系列加工中心故障間隔時間的觀測值來擬合其概率密度函數(shù)。將故障間隔時間的觀測值t∈[7.06, 1494.51]分為13組,如表1所示。
表1 TH42系列加工中心故障頻率
Table 1
組號 | 區(qū)間上 | 區(qū)間下 | 組中值 | 頻數(shù) | 頻率 | 累計 |
1 | 7.06 | 121.48 | 64.27 | 4 | 0.1333 | 0.1333 |
2 | 121.48 | 235.9 | 178.69 | 3 | 0.1 | 0.2333 |
3 | 235.9 | 350.32 | 293.11 | 4 | 0.1333 | 0.3667 |
4 | 350.32 | 464.74 | 407.53 | 4 | 0.1333 | 0.5 |
5 | 464.74 | 579.16 | 521.95 | 5 | 0.1667 | 0.6667 |
6 | 579.16 | 693.58 | 636.37 | 1 | 0.0333 | 0.7 |
7 | 693.58 | 807.99 | 750.79 | 4 | 0.1333 | 0.8333 |
8 | 807.99 | 922.41 | 865.2 | 2 | 0.0667 | 0.9 |
9 | 922.41 | 1036.83 | 979.62 | 0 | 0 | 0.9 |
10 | 1036.83 | 1151.25 | 1094.04 | 0 | 0 | 0.9 |
11 | 1151.25 | 1265.67 | 1208.46 | 1 | 0.0333 | 0.9333 |
12 | 1265.67 | 1380.09 | 1322.88 | 1 | 0.0333 | 0.9667 |
13 | 1380.09 | 1494.51 | 1437.3 | 1 | 0.0333 | 1 |
以每組時間的中值為橫坐標(biāo),每組的概率密度的觀測值f(t)為縱坐標(biāo),f(t)的計算如下: (1)
式中:ni———每組故障間隔時間中的故障頻數(shù);
n———早期故障總頻數(shù),本試驗為30次;
———組距,為114.42h。
由此擬合出的概率密度函數(shù)的曲線如圖5所示。
由概率論可知,故障間隔時間的概率密度曲線呈單調(diào)下降趨勢。可見,該加工中心故障間隔時間所服從的分布不會是正態(tài)分布或?qū)?shù)正態(tài)分布,而可能是指數(shù)分布或威布爾分布。
1. 2 MTBF的經(jīng)驗分布函數(shù)
該系列加工中心故障間隔時間的理論分布函數(shù)可定義為:F(t)=P{T < t} (2)
式中:T———故障間隔時間總體;t———任意故障間隔時間。
設(shè)t1,t2,……,tn為故障間隔時間的觀測值,由該組觀測值所得到的故障間隔時間的順序統(tǒng)計量為
t(1),t(2),……,t(n),則該加工中心故障間隔時間的經(jīng)驗分布函數(shù)為: (3)
當(dāng)樣本容量n足夠大時,用樣本觀測值所求出的經(jīng)驗分布函數(shù)F(n)(t)與理論分布函數(shù)F(t)之差的最大值便足夠的小,此時可由F(n)(t)來估計F(t)。
故障間隔時間的分布函數(shù)F(t)同其密度函數(shù)f(t)之間的關(guān)系為:f(t)=F′(t) (4) 若故障間隔時間概率密度函數(shù)f(t)呈峰值形,如正態(tài)分布和對數(shù)正態(tài)分布,則分布函數(shù)F(t)將出現(xiàn)拐點。即:f′(t)=0→F″(t)=0 (5) 若故障間隔時間的概率密度函數(shù)f(t)呈單調(diào)下降趨勢,則其分布函數(shù)F(t)在正半軸上將是凸的。即:f′(t)<0→F″(t)<0 (6)
同理,若故障間隔時間概率密度函數(shù)f(t)呈單調(diào)上升趨勢,則分布函數(shù)F(t)在正半軸上將是凹的。
由上述討論可知,由經(jīng)驗分布函數(shù)F(n)(t)可估計理論分布函數(shù)F(t),而由F(t)的形狀可初步判斷f(t)的形狀,所以由F(n)(t)的形狀亦可初步判斷f(t)的形狀。
由式(3)可知,F(n)(t)的圖形是階梯形折線圖,為擬合出F(n)(t)的連續(xù)曲線,將式(3)簡化為:F(n)(t)=i/n,i=1,2,……,n (7)
下面對F(n)(t)進行擬合。將該系列加工中心故障間隔時間的觀測值t∈[7.06,1494.51]分為13組。以每組時間的中值為橫坐標(biāo),每組的累積頻率為縱坐標(biāo),由此擬合出的F(n)(t)的曲線如圖6所示。
由圖可知,故障間隔時間的經(jīng)驗分布函數(shù)F(n)(t)為外凸,無拐點??梢?該加工中心故障間隔時間所服從的分布不會是正態(tài)分布或?qū)?shù)正態(tài)分布,而可能是指數(shù)分布或威布爾分布。
2 故障間隔時間分布模型的擬合檢驗
已知該加工中心故障間隔時間可能服從指數(shù)分布或威布爾分布。而威布爾分布包含指數(shù)分布。所以假設(shè)故障間隔時間服從威布爾分布,為確定該加工中心故障間隔時間分布規(guī)律,可用最小二乘法進行參數(shù)估計,并運用相關(guān)系數(shù)法來檢驗威布爾分布。
2. 1 初選分布模型
通常在實際應(yīng)用時,我們假設(shè)產(chǎn)品剛剛投入生產(chǎn)時產(chǎn)品便發(fā)生故障。這樣就可以用兩參數(shù)威布爾分布對故障間隔時間的分布規(guī)律進行研究。
則公式為: (8) (9)
2. 2 參數(shù)估計
(1)一元線性回歸模型
分布類型的參數(shù)估計方法可分為圖估計法、矩法、極大似然法及最小二乘法等。對于威布爾分布、極值分布等不含積分的累積分布函數(shù)采用一元線性回歸方法進行參數(shù)估計。
假設(shè)試驗中獲得n對試驗數(shù)據(jù):(x1,y1)、(x2,y2)、……、(xn,yn),將它們標(biāo)在直角坐標(biāo)紙上,從圖形上
看,數(shù)據(jù)點大體上散布在某條直線周圍,變量間近似地呈現(xiàn)為線性關(guān)系??勺饕恢本€,設(shè)直線方程為:
式中,參數(shù)B為該直線的斜率,A為截矩。
(2)用最小二乘法進行參數(shù)估計
(10)
則用最小二乘法估計出參數(shù)A、B的估計量為: (11) 代入上述直線方程中,即得到y(tǒng)對x的一元線性回歸方程: (12)
首先將試驗所得到的故障間隔時間數(shù)據(jù)ti按由小到大的次序排列,并取中位秩作為各試驗點的У值。然后假設(shè)一種分布類型,進行變換后,即可用式(1-14)式進行計算,估計得系數(shù)B、A后,即可進行原函數(shù)的參數(shù)估計。
對于兩參數(shù)威布爾分布,其累積分布函數(shù)為:F(t) = 1 ? [exp ? (t / α)β] (13)
式中:t≥0;k > 0,k為形狀參數(shù);b > 0,b為尺寸參數(shù)。
對式(1-15)兩端進行變換,并取自然對數(shù)得: (14)
令:,x = lnt,B=β,A=-βlnα
則:y=A+BX (15)
通過最小二乘法對威布爾分布的兩參數(shù)進行估計。求得:B=0.864,A=-5.5714
又因為B=β,A=-βlnα,所以β=0.864,α=631.746
2. 3 威布爾分布的假設(shè)檢驗
(1)線性相關(guān)性檢驗
對于任一組試驗數(shù)據(jù),按照上面介紹的公式都能建立線性回歸方程,但變量x與y之間是否真正存在線性相關(guān)的關(guān)系,這就是線性相關(guān)性檢驗問題。采用線性相關(guān)系數(shù)檢驗法。相關(guān)系數(shù)為: (16)
相關(guān)系數(shù)為線性相關(guān),其值越接近1,表示x與y的線性相關(guān)性越強。當(dāng)時,則也認(rèn)為x與y是線性相關(guān)的。其中ρα是相關(guān)系數(shù)起碼值,當(dāng)n = 30,顯著性水平= 0. 1時,相關(guān)系數(shù)起碼值ρα = 0.3055。求得:,且 所以x與y是線性相關(guān)的,即線性回歸的效果是顯著的。
(2)分布擬合的假設(shè)檢驗
常用的擬合優(yōu)度檢驗方法有x2檢驗法和d檢驗法。x2檢驗法一般只用于大樣本,而且對于截尾樣本容易犯第Ⅱ類錯誤;d檢驗法比x2檢驗法精細(xì),而且實用于小樣本的情況。本加工中心的故障數(shù)據(jù)比較適用于d檢驗。所以將對該系列加工中心故障間隔時間的分布函數(shù)進行d檢驗。
d檢驗法的拒絕域為: (17)
式中:F0(x)———原假設(shè)分布函數(shù);Fn(x)———樣本大小為n的經(jīng)驗分布函數(shù);Dn,α———臨界值。
將n個試驗數(shù)據(jù)按由小到大的次序排列,根據(jù)假設(shè)的分布,計算每個數(shù)據(jù)對應(yīng)的F0(xi),將其與經(jīng)驗分布函數(shù)Fn(xi)進行比較,其中差值的最大絕對值即檢驗統(tǒng)計量Dn的觀察值。將Dn與臨界值Dn,α進行比較。滿足下列條件,則接受原假設(shè),否則拒絕原假設(shè)。
假設(shè)故障間隔時間服從威布爾分布F(t)=1-[exp-(t/631.746)0.864]
可求得:Dn,α=0.2227 Dn=0.158,因為Dn,α>Dn,故接受原假設(shè)。
所以故障間隔時間(MTBF)服從威布爾分布。
3 結(jié)論
該系列加工中心故障符合威布爾分布;分布模型為:F(t)=1-[exp-(t/631.746)0.864]。
由此可以進行故障預(yù)測,預(yù)測下一次故障發(fā)生的時間間隔,為保證數(shù)控機床可靠性提供理論基礎(chǔ)。