登錄

MTBF

1.MTBF概述

MTBF,平均故障間隔時間又稱平均無故障時間,英文全稱是“Mean Time Between Failure”指可修復產品兩次相鄰故障之間的平均時間,記為MTBF。MTBF是衡量一個產品(尤其是電器產品)的可靠性指標。單位為“小時”。它反映了產品的時間質量,是體現(xiàn)產品在規(guī)定時間內保持功能的一種能力。具體來說,它僅適用于可維修產品。同時也規(guī)定產品在總的使用階段累計工作時間與故障次數(shù)的比值為MTBF。磁盤陣列產品一般MTBF不能低于50000小時。

隨著伺服器的廣泛應用,對伺服器的可靠性提出了更高的要求。所謂“可靠性”,就是產品在規(guī)定條件下和規(guī)定時間內完成規(guī)定功能的能力;反之,產品或其一部分不能或將不能完成規(guī)定的功能是出故障。概括地說,產品故障少的就是可靠性高,產品的故障總數(shù)與壽命單位總數(shù)之比叫“故障率”(Failure rate),常用λ表示。例如正在運行中的100只硬碟,一年之內出了2次故障,則每個硬碟的故障率為0.02次/年。當產品的壽命服從指數(shù)分布時,其故障率的倒數(shù)就叫做平均故障間隔時間(Mean Time Between Failures),簡稱MTBF。

2.MTBF的計算

  設有一個可修復的產品在使用過程中,共計發(fā)生過N0次故障,每次故障后經過修復又和新的一樣繼續(xù)投入使用,其工作時間分別為:t_1,t_2,t_3,cdots,t_0,那么產品的平均故障間隔時間,也就是平均壽命為Q為:

  Q=MTBF=frac{1}{N} sum_{i=1}^{N_0}T_i

  通常,我們在產品的手冊或包裝上能夠看到這個MTBF值,如8000小時,2萬小時,那么,MTBF的數(shù)值是怎樣算出來的呢,假設一臺電腦的MTBF 為3萬小時,是不是把這臺電腦連續(xù)運行3萬小時檢測出來的呢?答案是否定的,如果是那樣的話,我們有那么多產品要用幾十年都檢測不完的。其實,關于 MTBF值的計算方法,目前最通用的權威性標準是MIL-HDBK-217、GJB/Z299B和Bellcore,分別用于軍工產品和民用產品。其中,MIL-HDBK-217是由美國國防部可靠性分析中心及Rome實驗室提出并成為行業(yè)標準,專門用于軍工產品MTBF值計算,GJB/Z299B是我國軍用標準;而Bellcore是由AT&TBell實驗室提出并成為商用電子產品MTBF值計算的行業(yè)標準。

  MTBF計算中主要考慮的是產品中每個器件的失效率。但由于器件在不同的環(huán)境、不同的使用條件下其失效率會有很大的區(qū)別,例如,同一產品在不同的環(huán)境下,如在實驗室和海洋平臺上,其可靠性值肯定是不同的;又如一個額定電壓為16V的電容在實際電壓為25V和5V下的失效率肯定是不同的。所以,在計算可靠性指標時,必須考慮上述多種因素。所有上述這些因素,幾乎無法通過人工進行計算,但借助于軟件如MTBFcal軟件和其龐大的參數(shù)庫,我們就能夠輕松的得出MTBF值。

3.MTTF、MTBF和MTTR的區(qū)別

可靠性是最初是確定一個系統(tǒng)在一個特定的運行時間內有效運行的概率的一個標準。可靠性的衡量需要系統(tǒng)在某段時間內保持正常的運行。

目前,使用最為廣泛的一個衡量可靠性的參數(shù)是,MTTF(mean time to failure,平均失效前時間),定義為隨機變量、出錯時間等的"期望值"。但是,MTTF經常被錯誤地理解為,"能保證的最短的生命周期"。MTTF 的長短,通常與使用周期中的產品有關,其中不包括老化失效。

MTTR(mean time to restoration,平均恢復前時間),源自于IEC 61508中的平均維護時間(mean time to repair),目的是為了清楚界定術語中的時間的概念,MTTR是隨機變量恢復時間得期望值。它包括確認失效發(fā)生所必需的時間,以及維護所需要的時間。 MTTR也必須包含獲得配件的時間,維修團隊的響應時間,記錄所有任務的時間,還有將設備重新投入使用的時間。

MTBF(Mean time between failures,平均故障間隔時間)定義為,失效或維護中所需要的平均時間,包括故障時間以及檢測和維護設備的時間。對于一個簡單的可維護的元件,MTBF = MTTF + MTTR。因為MTTR通常遠小于MTTF,所以MTBF近似等于MTTF,通常由MTTF替代。MTBF用于可維護性和不可維護的系統(tǒng)。

4.MTBF分析的目的[1]

1)針對高頻率故障零件的重點對策及零件壽命延長的技術改造依據(jù)。

2)進行零件壽命周期的推算及最佳維修計劃編制。

3)有關點檢對象、項目的選擇與點檢基準的設定、改善。

4)用于指導內外部維修工作分配。根據(jù)公司內設備修復能力的評價,以設備類型、作業(yè)種類的不同來決定內部分別承擔工作的維修質量與設備效率方面的風險,作為維修外包的重要參考。

5)設定備品備件基準。機械、電氣零件的各儲備項目及基本庫存數(shù)量,應根據(jù)MTBF的記錄分析來判斷,使其庫存水平達到最經濟的狀況。

6)作為選擇維修技術方法改善重點的參考依據(jù)。為了提高設備開動率,必須縮短與設備停機相關的長時間維修作業(yè)及工程調整、切換的時間。因此,有必要對維護作業(yè)方法進行檢驗,而其檢驗的項目、優(yōu)先順序的選擇等基本情況,均需要依據(jù)MTBF的分析記錄表。

7)用于設備對象設定預估運行時間標準,及其維護作業(yè)的選定與維護時間標準的研究。維修計劃預估時間標準的設定及維護作業(yè)的選定,必須考慮設備維護重復周期或標準時間值與實際維護時間的差異及相應維護作業(yè)特性等因素,因此,MTBF分析表是非常必要的。

8)圖樣整理及重新選定重點設備或零件時的參考。MTBF的分析記錄表所記錄的設備零件改造項目或摩擦劣化等信息,以及設備圖樣修改或前期制作等情況,通過能經常作分析檢驗及重要性排序管理,可以使工程圖樣管理變得更容易。

9)運行操作標準的設定、修訂及決定設備維護業(yè)務的責任分派。

10)提供設備的可靠性、可維修性設計的技術資料。維護技術最重要的是以MTBF分析表為基礎,收集有關設備的可靠性、可維修性設計的技術信息,以便提供給設計部門在設計設備時參考。

5.MTBF分析的應用[1]

1)對于維修部門而言,很難了解維修活動與產品質量間的關系。例如,就故障修理而言,一般多以功能修理為重點,不會去確認維修作業(yè)所達到的產品質量改善的情況。但如何將產品質量和維修活動相結合,是非常重要的,MTBF分析表可作為重要的參考資料。

2)PM(生產維修)是著重以設備診斷技術為中心的預知維修,但其具體課題結果是很難把握的;從MTBF分析表中,找出設備診斷技術開發(fā)的課題,是一種很有效果的做法。

3)設備培訓資料的制作:培養(yǎng)對設備熟悉、能力強的人員是PM的重要課題,然而一般培訓多以市面上銷售書籍為范本,并沒有充分結合自己公司、單位的問題狀況,與書本上所述的背景問更存在著差異。因此,如果能利用MTBF分析,培訓有關公司生產設備的結構、功能、薄弱環(huán)節(jié)及注意事項,是較具體的做法。

4)關于設備壽命周期費用(LifeCycleCost,LCC)的把握及其研究資料:MTBF分析表,是以設備為主體,經長期而編制的一覽表。因此,根據(jù)設備所發(fā)生的維修作業(yè)、費用、備品備件及損失的發(fā)生狀況,來掌握設備壽命周期費用資料,是設備一生管理的重要基礎。綜上所述,MTBF分析不僅是維修記錄的方法之一,其維修記錄更可作為維護活動、管理和技術活動指南的原始資料,價值和意義重大。

6.制作MTBF分析表的注意事項[1]

1)應具備一覽性,盡可能將相關資料整理在一張表上,不要散亂。

2)將一特定期間內的維修數(shù)據(jù)及相關資料,按照時間序列進行整理、記錄,以便于了解。

3)可同時進行維修的記錄和分析。

4)多花點心思,在一張表內整理多種信息:不僅可以將設備故障或維修資料記錄下來,還可將質量、安全、成本等信息整理成與制造、設計、技術相關的參考資料。

5)通過MTBF分析表即可了解設備管理的重點。

6)通過MTBF分析表可判斷故障和維護的關系。

7)了解改善對策及對策實施后的效果。

8)應使任何人都可容易進行資料的記錄。例如在一年設備開動期間曾發(fā)生4次故障,則平均故障間隔時間為3個月。以【圖1】為例,可以推算出每3個月將會發(fā)生一次故障。另外,也可依照這些故障點的分布狀況,推斷下次可能發(fā)生故障的設備部位及零件。

Image:通過MTBF推算故障發(fā)生時機.jpg

7.MTBF分析表制作的五個步驟[1]

步驟1:確定要分析的設備對象——通常先選擇重點設備來記錄,也可以按某類設備群或針對設備某重點部位進行記錄。

步驟2:故障資料的收集——以過去3~5年或至少30次以上的設備故障資料來分析。

步驟3:故障分布圖的繪制——將設備整體示意圖繪出,利用步驟2的資料,標示出故障部位,如【圖2】所示。

Image:故障分布圖的繪制示例.jpg

步驟4:編制MTBF分析表(如【圖3】所示)。

Image:MTBF分析表示例.jpg

·分析表的內容以能記入一年的資料為準。

·將步驟3的內容,按部位類別、發(fā)生日期順序記錄。

·盡可能用圖形方式或顏色類別、記號記錄,以增加易讀性。

·持續(xù)記錄到“設備突發(fā)故障為零時”為止。

步驟5:故障分析及對策的檢驗。

·由MTBF分析表來做故障原因分析及對策檢驗(常用的分析方法包括柏拉圖、特征要因圖(魚骨圖)和故障樹法等,如【圖4】所示)。

·對策方法應采用易懂的方式,并切實可行。

Image:常用的分析方法.jpg

8.MTBF的案例分析

案例一:MTBF分布模型的案例分析[2]

  考核機電產品的可靠性水平通常用平均故障間隔時間(MTBF)來衡量,即:考核產品在規(guī)定條件下和規(guī)定時間內,完成規(guī)定功能的能力。根據(jù)考核結果(MTBF)的值,判斷該產品目前在國內外同類產品中所處地位,對于可靠性水平較低的產品,提出相應改進措施,切實提高產品可靠性。歸根結底要對MTBF進行分析。

  下面以某數(shù)控機床廠生產的系列加工中心為例,通過對采用定時截尾的方法對6臺同系列不同編號的加工中心現(xiàn)場使用情況所收集的共30條數(shù)據(jù)進行分析,根據(jù)故障觀測值的分布形狀來擬合已知線形,應用數(shù)理統(tǒng)計中的參數(shù)估計、假設檢驗等方法進行驗證,從而判斷出故障間隔時間的分布模型,為進行故障分析、預測及實現(xiàn)可靠性增長提供了理論依據(jù)。

  •   1 故障間隔時間分布模型的初步判斷

  •   1. 1 概率密度的觀測值

  下面由該系列加工中心故障間隔時間的觀測值來擬合其概率密度函數(shù)。將故障間隔時間的觀測值t∈[7.06, 1494.51]分為13組,如表1所示。

表1 TH42系列加工中心故障頻率

Table 1 

組號區(qū)間上區(qū)間下組中值頻數(shù)頻率累計
17.06121.4864.2740.13330.1333
2121.48235.9178.6930.10.2333
3235.9350.32293.1140.13330.3667
4350.32464.74407.5340.13330.5
5464.74579.16521.9550.16670.6667
6579.16693.58636.3710.03330.7
7693.58807.99750.7940.13330.8333
8807.99922.41865.220.06670.9
9922.411036.83979.62000.9
101036.831151.251094.04000.9
111151.251265.671208.4610.03330.9333
121265.671380.091322.8810.03330.9667
131380.091494.511437.310.03331

  

以每組時間的中值為橫坐標,每組的概率密度的觀測值f(t)為縱坐標,f(t)的計算如下:f(t)=n_i/ntriangle t_i  (1)

  式中:ni———每組故障間隔時間中的故障頻數(shù);

    n———早期故障總頻數(shù),本試驗為30次;

    triangle t_i———組距,為114.42h。

  由此擬合出的概率密度函數(shù)的曲線如圖5所示。

  由概率論可知,故障間隔時間的概率密度曲線呈單調下降趨勢??梢?該加工中心故障間隔時間所服從的分布不會是正態(tài)分布或對數(shù)正態(tài)分布,而可能是指數(shù)分布或威布爾分布。

  •   1. 2 MTBF的經驗分布函數(shù)

  該系列加工中心故障間隔時間的理論分布函數(shù)可定義為:F(t)=P{T < t}  (2)

  式中:T———故障間隔時間總體;t———任意故障間隔時間。

  設t1,t2,……,tn為故障間隔時間的觀測值,由該組觀測值所得到的故障間隔時間的順序統(tǒng)計量為

t(1),t(2),……,t(n),則該加工中心故障間隔時間的經驗分布函數(shù)為:F_{(n)}(t)=begin{cases} 0,t < t_(i)  i/n,t(i)le t< t_{(i+1)},i=1,2,ldots n 1,tge t(n)end{cases}  (3)

  當樣本容量n足夠大時,用樣本觀測值所求出的經驗分布函數(shù)F(n)(t)與理論分布函數(shù)F(t)之差的最大值便足夠的小,此時可由F(n)(t)來估計F(t)。

  故障間隔時間的分布函數(shù)F(t)同其密度函數(shù)f(t)之間的關系為:f(t)=F′(t)  (4)  若故障間隔時間概率密度函數(shù)f(t)呈峰值形,如正態(tài)分布和對數(shù)正態(tài)分布,則分布函數(shù)F(t)將出現(xiàn)拐點。即:f′(t)=0→F″(t)=0  (5)  若故障間隔時間的概率密度函數(shù)f(t)呈單調下降趨勢,則其分布函數(shù)F(t)在正半軸上將是凸的。即:f′(t)<0→F″(t)<0  (6)

  同理,若故障間隔時間概率密度函數(shù)f(t)呈單調上升趨勢,則分布函數(shù)F(t)在正半軸上將是凹的。

  由上述討論可知,由經驗分布函數(shù)F(n)(t)可估計理論分布函數(shù)F(t),而由F(t)的形狀可初步判斷f(t)的形狀,所以由F(n)(t)的形狀亦可初步判斷f(t)的形狀。

  由式(3)可知,F(n)(t)的圖形是階梯形折線圖,為擬合出F(n)(t)的連續(xù)曲線,將式(3)簡化為:F(n)(t)=i/n,i=1,2,……,n  (7)

  下面對F(n)(t)進行擬合。將該系列加工中心故障間隔時間的觀測值t∈[7.06,1494.51]分為13組。以每組時間的中值為橫坐標,每組的累積頻率為縱坐標,由此擬合出的F(n)(t)的曲線如圖6所示。

  由圖可知,故障間隔時間的經驗分布函數(shù)F(n)(t)為外凸,無拐點??梢?該加工中心故障間隔時間所服從的分布不會是正態(tài)分布或對數(shù)正態(tài)分布,而可能是指數(shù)分布或威布爾分布。

  •   2 故障間隔時間分布模型的擬合檢驗

  已知該加工中心故障間隔時間可能服從指數(shù)分布或威布爾分布。而威布爾分布包含指數(shù)分布。所以假設故障間隔時間服從威布爾分布,為確定該加工中心故障間隔時間分布規(guī)律,可用最小二乘法進行參數(shù)估計,并運用相關系數(shù)法來檢驗威布爾分布。

  •   2. 1 初選分布模型

  通常在實際應用時,我們假設產品剛剛投入生產時產品便發(fā)生故障。這樣就可以用兩參數(shù)威布爾分布對故障間隔時間的分布規(guī)律進行研究。

  則公式為:f(t)=frac{beta}{alpha}(frac{t}{alpha})^{beta-1}exp[-(frac{t}{alpha})^beta],tge 0  (8)F(t)=1-exp[-(frac{t}{alpha})^beta],tge 0  (9)

  •   2. 2 參數(shù)估計

  •   (1)一元線性回歸模型

  分布類型的參數(shù)估計方法可分為圖估計法、矩法、極大似然法及最小二乘法等。對于威布爾分布、極值分布等不含積分的累積分布函數(shù)采用一元線性回歸方法進行參數(shù)估計。

  假設試驗中獲得n對試驗數(shù)據(jù):(x1,y1)、(x2,y2)、……、(xn,yn),將它們標在直角坐標紙上,從圖形上

看,數(shù)據(jù)點大體上散布在某條直線周圍,變量間近似地呈現(xiàn)為線性關系??勺饕恢本€,設直線方程為:hat{y}=A+Bx

  式中,參數(shù)B為該直線的斜率,A為截矩。

  •   (2)用最小二乘法進行參數(shù)估計

    bar{x}=frac{1}{n}sum_{i=1}^n x_i  bar{y}=frac{1}{n}sum_{i=1}^n y_i  (10)

  則用最小二乘法估計出參數(shù)A、B的估計量為:hat{A}=y-hat{B}bar{x}  hat{B}=frac{sum_{i=1}^n x_iy_i-nbar{xy}}{sum_{i=1}^n x_i^2-nx^2}  (11)  代入上述直線方程中,即得到y(tǒng)對x的一元線性回歸方程:hat{y}=hat{A}+hat{B}x  (12)

  首先將試驗所得到的故障間隔時間數(shù)據(jù)ti按由小到大的次序排列,并取中位秩作為各試驗點的У值。然后假設一種分布類型,進行變換后,即可用式(1-14)式進行計算,估計得系數(shù)B、A后,即可進行原函數(shù)的參數(shù)估計。

  對于兩參數(shù)威布爾分布,其累積分布函數(shù)為:F(t) = 1 ? [exp ? (t / α)β]  (13)

  式中:t≥0;k > 0,k為形狀參數(shù);b > 0,b為尺寸參數(shù)。

  對式(1-15)兩端進行變換,并取自然對數(shù)得:ln ln Big {1/bigg [(1-F(t))bigg ]Big }=betaln t-beta ln alpha  (14)

  令:y=ln ln Big {1/bigg [(1-F(t))bigg ]Big },x = lnt,B=β,A=-βlnα

  則:y=A+BX    (15)

  通過最小二乘法對威布爾分布的兩參數(shù)進行估計。求得:B=0.864,A=-5.5714

  又因為B=β,A=-βlnα,所以β=0.864,α=631.746

  •   2. 3 威布爾分布的假設檢驗

  •   (1)線性相關性檢驗

  對于任一組試驗數(shù)據(jù),按照上面介紹的公式都能建立線性回歸方程,但變量x與y之間是否真正存在線性相關的關系,這就是線性相關性檢驗問題。采用線性相關系數(shù)檢驗法。相關系數(shù)為:hat{rho }=frac{sum_{i=1}^n x_iy_i-nbar{xy}}{sqrt{[sum_{i=1}^n x_i^2-nx^2][sum_{i=1}^n y_i^2-ny^2]}}  (16)

  相關系數(shù)hat{rho }le 1為線性相關,其值越接近1,表示x與y的線性相關性越強。當hat{rho }> rho alpha時,則也認為x與y是線性相關的。其中ρα是相關系數(shù)起碼值,當n = 30,顯著性水平= 0. 1時,相關系數(shù)起碼值ρα = 0.3055。求得:hat{rho }=0.9459approx 1,且hat{rho }> rho alpha 所以x與y是線性相關的,即線性回歸的效果是顯著的。

  •   (2)分布擬合的假設檢驗

  常用的擬合優(yōu)度檢驗方法有x2檢驗法和d檢驗法。x2檢驗法一般只用于大樣本,而且對于截尾樣本容易犯第Ⅱ類錯誤;d檢驗法比x2檢驗法精細,而且實用于小樣本的情況。本加工中心的故障數(shù)據(jù)比較適用于d檢驗。所以將對該系列加工中心故障間隔時間的分布函數(shù)進行d檢驗。

  d檢驗法的拒絕域為:D_n=sup_{-infty<x < infty}|F_n(x)-F_0(x)|=max{d_i}le D_{n,alpha}  (17)

  式中:F0(x)———原假設分布函數(shù);Fn(x)———樣本大小為n的經驗分布函數(shù);Dn———臨界值。

  將n個試驗數(shù)據(jù)按由小到大的次序排列,根據(jù)假設的分布,計算每個數(shù)據(jù)對應的F0(xi),將其與經驗分布函數(shù)Fn(xi)進行比較,其中差值的最大絕對值即檢驗統(tǒng)計量Dn的觀察值。將Dn與臨界值Dn進行比較。滿足下列條件,則接受原假設,否則拒絕原假設。

  假設故障間隔時間服從威布爾分布F(t)=1-[exp-(t/631.746)0.864]

  可求得:Dn=0.2227 Dn=0.158,因為Dn>Dn,故接受原假設。

  所以故障間隔時間(MTBF)服從威布爾分布。

  •   3 結論

  該系列加工中心故障符合威布爾分布;分布模型為:F(t)=1-[exp-(t/631.746)0.864]。

  由此可以進行故障預測,預測下一次故障發(fā)生的時間間隔,為保證數(shù)控機床可靠性提供理論基礎。

評論  |   0條評論