平均故障間隔時間

計算機系統運行術語之一

平均故障間隔時間,是指產品或系統在兩相鄰故障間隔期內正確工作的平均時間,也稱平均無故障工作時間。它是標誌產品或系統能平均工作多長時間的量,用MTBF表示。

MTBF,平均故障間隔時間又稱平均無故障時間,英文全稱是“Mean Time Between Failure,是衡量一個產品(尤其是電器產品)的可靠性指標,單位為“小時”。

計算方法


隨著伺服器的廣泛應用,對伺服器的可靠性提出了更高的要求。所謂“可靠性”,就是產品在規定條件下和規定時間內完成規定功能的能力;反之,產品或其一部分不能或將不能完成規定的功能是出故障。概括地說,產品故障少的就是可靠性高,產品的故障總數與壽命單位總數之比叫“故障率”(Failure rate),常用λ表示。一款可用於伺服器的WD Caviar RE2 7200 RPM 硬碟,MTBF 高達 120萬小時,保修 5年。120萬小時約為137年,並不是說該種硬碟每隻均能工作137年不出故障。由MTBF=1/λ可知λ=1/MTBF=1/137年,即該硬碟的平均年故障率約為0.7%,一年內,平均1000隻硬碟有7隻會出故障。當產品的壽命服從指數分佈時,其故障率的倒數就叫做平均故障間隔時間(Mean Time Between Failures),簡稱MTBF。
通常,我們在產品的手冊或包裝上能夠看到這個MTBF值,如8000小時,2萬小時,那麼,MTBF的數值是怎樣算出來的呢,假設一台電腦的MTBF 為3萬小時,是不是把這台電腦連續運行3萬小時檢測出來的呢?答案是否定的,如果是那樣的話,我們有那麼多產品要用幾十年都檢測不完的。其實,關於 MTBF值的計算方法,最通用的權威性標準是MIL-HDBK-217、GJB/Z299B和Bellcore,分別用于軍工產品和民用產品。其中,MIL-HDBK-217是由美國國防部可靠性分析中心及Rome實驗室提出並成為行業標準,專門用于軍工產品MTBF值計算,GJB/Z299B是我國軍用標準;而Bellcore是由AT&TBell實驗室提出並成為商用電子產品MTBF值計算的行業標準。
MTBF計算中主要考慮的是產品中每個器件的失效率。但由於器件在不同的環境、不同的使用條件下其失效率會有很大的區別,例如,同一產品在不同的環境下,如在實驗室和海洋平台上,其可靠性值肯定是不同的;又如一個額定電壓為16V的電容在實際電壓為25V和5V下的失效率肯定是不同的。所以,在計算可靠性指標時,必須考慮上述多種因素。所有上述這些因素,幾乎無法通過人工進行計算,但藉助於軟體如MTBFcal軟體和其龐大的參數庫,我們就能夠輕鬆的得出MTBF值。
可靠性是最初是確定一個系統在一個特定的運行時間內有效運行的概率的一個標準。可靠性的衡量需要系統在某段時間內保持正常的運行。

近義詞區別

MTTF、MTBF和MTTR的區別
可靠性是最初是確定一個系統在一個特定的運行時間內有效運行的概率的一個標準。可靠性的衡量需要系統在某段時間內保持正常的運行。
使用最為廣泛的一個衡量可靠性的參數是,MTTF(mean time to failure,平均失效前時間),定義為隨機變數、出錯時間等的"期望值"。但是,MTTF經常被錯誤地理解為,"能保證的最短的生命周期"。MTTF 的長短,通常與使用周期中的產品有關,其中不包括老化失效。
MTTR(mean time to restoration,平均恢復前時間),源自於IEC61508中的平均維護時間(mean time to repair),目的是為了清楚界定術語中的時間的概念,MTTR是隨機變數恢復時間的期望值。它包括確認失效發生所必需的時間,以及維護所需要的時間。 MTTR也必須包含獲得配件的時間,維修團隊的響應時間,記錄所有任務的時間,還有將設備重新投入使用的時間。
MTBF(Mean time between failures,平均故障間隔時間)定義為,失效或維護中所需要的平均時間,包括故障時間以及檢測和維護設備的時間。對於一個簡單的可維護的元件,MTBF = MTTF + MTTR。因為MTTR通常遠小於MTTF,所以MTBF近似等於MTTF,通常由MTTF替代。MTBF用於可維護性和不可維護的系統。

分析目的

1)針對高頻率故障零件的重點對策及零件壽命延長的技術改造依據。
2)進行零件壽命周期的推算及最佳維修計劃編製。
3)有關點檢對象、項目的選擇與點檢基準的設定、改善。
4)用於指導內外部維修工作分配。根據公司內設備修復能力的評價,以設備類型、作業種類的不同來決定內部分別承擔工作的維修質量與設備效率方面的風險,作為維修外包的重要參考。
5)設定備品備件基準。機械、電氣零件的各儲備項目及基本庫存數量,應根據MTBF的記錄分析來判斷,使其庫存水平達到最經濟的狀況。
6)作為選擇維修技術方法改善重點的參考依據。為了提高設備開動率,必須縮短與設備停機相關的長時間維修作業及工程調整、切換的時間。因此,有必要對維護作業方法進行檢驗,而其檢驗的項目、優先順序的選擇等基本情況,均需要依據MTBF的分析記錄表。
7)用於設備對象設定預估運行時間標準,及其維護作業的選定與維護時間標準的研究。維修計劃預估時間標準的設定及維護作業的選定,必須考慮設備維護重複周期或標準時間值與實際維護時間的差異及相應維護作業特性等因素,因此,MTBF分析表是非常必要的。
8)圖樣整理及重新選定重點設備或零件時的參考。MTBF的分析記錄表所記錄的設備零件改造項目或摩擦劣化等信息,以及設備圖樣修改或前期製作等情況,通過能經常作分析檢驗及重要性排序管理,可以使工程圖樣管理變得更容易。
9)運行操作標準的設定、修訂及決定設備維護業務的責任分派。
10)提供設備的可靠性、可維修性設計的技術資料。維護技術最重要的是以MTBF分析表為基礎,收集有關設備的可靠性、可維修性設計的技術信息,以便提供給設計部門在設計設備時參考。

分析應用

1)對於維修部門而言,很難了解維修活動與產品質量間的關係。例如,就故障修理而言,一般多以功能修理為重點,不會去確認維修作業所達到的產品質量改善的情況。但如何將產品質量和維修活動相結合,是非常重要的,MTBF分析表可作為重要的參考資料。
2)PM(生產維修)是著重以設備診斷技術為中心的預知維修,但其具體課題結果是很難把握的;從MTBF分析表中,找出設備診斷技術開發的課題,是一種很有效果的做法。
3)設備培訓資料的製作:培養對設備熟悉、能力強的人員是PM的重要課題,然而一般培訓多以市面上銷售書籍為範本,並沒有充分結合自己公司、單位的問題狀況,與書本上所述的背景問更存在著差異。因此,如果能利用MTBF分析,培訓有關公司生產設備的結構、功能、薄弱環節及注意事項,是較具體的做法。
4)關於設備壽命周期費用(LifeCycleCost,LCC)的把握及其研究資料:MTBF分析表,是以設備為主體,經長期而編製的一覽表。因此,根據設備所發生的維修作業、費用、備品備件及損失的發生狀況,來掌握設備壽命周期費用資料,是設備一生管理的重要基礎。綜上所述,MTBF分析不僅是維修記錄的方法之一,其維修記錄更可作為維護活動、管理和技術活動指南的原始資料,價值和意義重大。

分析表

步驟1:確定要分析的設備對象——通常先選擇重點設備來記錄,也可以按某類設備群或針對設備某重點部位進行記錄。
步驟2:故障資料的收集——以過去3~5年或至少30次以上的設備故障資料來分析。
步驟3:故障分布圖的繪製——將設備整體示意圖繪出,利用步驟2的資料,標示出故障部位。
步驟4:編製MTBF分析表。
分析表的內容以能記入一年的資料為準。
將步驟3的內容,按部位類別、發生日期順序記錄。
儘可能用圖形方式或顏色類別、記號記錄,以增加易讀性。
持續記錄到“設備突發故障為零時”為止。
步驟5:故障分析及對策的檢驗。
由MTBF分析表來做故障原因分析及對策檢驗(常用的分析方法包括柏拉圖、特徵要因圖(魚骨圖)和故障樹法等)。
對策方法應採用易懂的方式,並切實可行。
通信科技運行、維護與管理
▪ 運行、管理與維護中心▪ 運行支撐系統▪ 維護▪ 維護準則
▪ 維護方針▪ 維護策略▪ 預防性維護▪ 維護等級
▪ 維護樹▪ 非現場維護▪ 定期維護▪ 可維護性
▪ 測試▪ 例行測試▪ 功能測試▪ 限值測試
▪ 能力測試▪ 行為測試▪ 一致性測試▪ 嵌套測試
▪ 診斷測試▪ 連續性檢查▪ 測量▪ 故障
▪ 性能監視▪ 故障糾正▪ 故障定位▪ 持久故障
▪ 間歇故障▪ 缺陷▪ 失效▪ 故障點
▪ 故障率▪ 故障容限▪ 故障樹分析▪ 故障遮掩
其他科技名詞
▪ 故障診斷▪ 恢復▪ 告警▪ 告警狀態
▪ 告警監視▪ 不影響功能性維護▪ 呼損▪ 平均故障間隔時間
▪ 平均失效時間▪ 平均修復時間▪ 遠程維護▪ 帶業務監測
▪ 聯絡線▪ 通道監視▪ 保護通道▪ 保護倒換
▪ 網管中心▪ 計費管理▪ 故障管理▪ 安全管理
▪ 性能管理▪ 配置管理▪ 管理實體▪ 被管實體
▪ 管理域▪ 管理層▪ 管理對象類▪ 客戶聯繫管理
▪ 服務管理系統▪ 管理信息▪ Q適配器▪ Q介面
▪ X介面
以上科技名詞按拼音字母排序,排名不分先後。