TPM故障樹分析法簡稱FTA (Failure Tree Analysis),是1961年為可靠性及安全情況,由美國貝爾電話研究室的華特先生首先提出的。其后,在航空和航天的設計、維修,原子反應堆、大型設備以及大型電子計算機系統中得到了廣泛的應用。目前,故障樹分析法雖還處在不斷完善的發展階段,但其應用范圍正在不斷擴大,是一種很有前途的故障分析法。
故障樹又稱問題樹、演繹樹或分解樹等。故障樹是將問題的所有子問題分層羅列,從最高層開始,并逐步向下擴展。故障樹分析法,是一種以樹狀圖形系統地分析存在的問題及其相互關系的方法。樹根:產生中心問題及子問題的原因;樹干:討論確定的有研究價值的中心問題;枝葉:與中心問題相關聯的子問題;果實:解決問題的策略。
把一個已知問題當成樹干,然后開始考慮這個問題和哪些相關問題或者子任務有關。每想到一點,就給這個問題(也就是樹干)加一個“樹枝”,并標明這個“樹枝”代表什么問題。一個大的“樹枝”上還可以有小的“樹枝”,如此類推,找出問題的所有相關聯項目。故障樹主要是幫助你理清自己的思路,不進行重復和無關的思考。
對于問題的分解我們期望引入系統思考的思路,即把問題分解為子問題,將子問題分層羅列,并要考慮問題之間的交互作用。問題樹的方法主要用在結構化問題分析上,因為有了問題樹就清楚了整個問題的構成,就可以對問題展開全面的調查研究和分析。故障樹能保證解決問題的過程的完整性;它能將工作細分為一些利于操作的部分;確定各部分的優先順序;明確地把責任落實到個人。故障樹是所界定的問題與議題之間的紐帶,它能在解決問題的小組內達成一種共識。
故障樹的方法主要用在結構化問題分析上,因為有了故障樹就清楚了整個問題的構成,就可以對問題展開全面的調查研究和分析。由于做了全面分析,因此可以保證不放過任何一個問題癥結。而非結構化的方法往往并不需要很細致地進行問題分解,當問題產生后非結構化分析的方法首先是根據個人的經驗先假設可能產生問題的分支和要素,再收集數據和通過分析去論證自我假設的正確性,這種方法在實際運用當中是非常有效的。
問題分析中的第一步就是細化問題的定義。在問題定義階段我們僅僅給出現狀和期望的差距即可,但是究竟是什么問題,問題的癥狀表現如何,這些內容就屬于問題定義的細化,由于在整個細化過程中就會涉及調查研究,然后根據收集回來的數據分析得出結論,這個過程其實就已經是問題分析的過程。
如果你不知道你要去哪里,那么你可以選擇任何一條路。分析問題的過程就是需要知道具體的目標,同時通過問題細化后給出結構化的問題定義才能夠互斥,并且綜合無遺漏。問題由哪些部分組成,一個是問題表象本身,一個是問題所作用的對象。這兩者都存在問題分解和細化的過程,通過分解后才能夠形成更加細小和容易解決的組件。舉例來說,我現在很難受,這個問題的作用對象是我,而我這個對象是可以分解的,即是生理上的難受還是心理上的難受,如果是身體上的是外部的還是內部的,內部的可能又涉及具體哪個部位難受。另外問題本身的表象也是可以分解的,是悲傷、痛苦還是焦慮,如果是痛苦的是隱痛、陣痛還是酸痛?通過這兩方面的分解后就基本清楚了如何對癥下藥。以此類推,就是這樣將問題分解的。
采用魚骨圖進行問題根源分析,是一種很常見的方式。當我們遇到問題的時候,對問題本身的分解和分析也同樣重要。我們可以采用思維導圖或故障樹的方法對問題本身進行分解,分解后你才會發現問題的產生不是單一的,而是由各種問題要素相互作用后才產生的,問題的表象也是由各種小問題的表象共同聚合而成的。有了這個思路就知道了問題本身遠遠比黑白是非要復雜得多,知道了解決問題不能忽視了整體,而片面地針對表象。一個問題要解決,關鍵的問題要素就是能夠使大家都滿意,而這種分析后我們就容易采用80/20原則確定問題的關鍵要素,并有針對性地去設計數據收集、分析和調查方案和行動。
從系統的角度來說,故障既有因設備中具體部件(硬件)的缺陷和性能惡化所引起的,也有因軟件,如自控裝置中的程序錯誤等引起的。此外,還有因為操作人員操作不當或不經心而引起的損壞故障。 總的說來,故障樹分析法具有以下一些特點。 它是一種從系統到部件,再到零件,按“下降形”分析的方法。它從系統開始,通過由故障符號繪制出的一個逐漸展開成樹狀的分枝圖,來分析故障事件(又稱頂端事件)發生的概率。同時也可以用來分析零件、部件或子系統故障對系統故障的影響,其中包括人為因素和環境條件等在內。 它對系統故障不但可以做定性的而且還可以做定量的分析;不僅可以分析由單一構件所引起的系統故障,而且也可以分析多個構件不同模式故障而產生的系統故障情況。因為故障樹分析法使用的是一個故障圖,因此,不論是設計人員或是使用和維修人員都容易掌握和運用,并且由它可派生出其他專門用途的“樹”。例如,可以繪制出專用于研究維修問題的維修樹,用于研究經濟效益及方案比較的決策樹等。 由于故障樹是一種故障門所構成的故障圖,因此適合于用電子計算機來計算;而且對于復雜系統的故障樹的構成和分析,也只有在應用計算機的條件下才能實現。 顯然,故障樹分析法也存在一些缺點。其中主要是構造故障樹的多余量相當繁重,難度也較大,對分析人員的要求也較高,因而限制了它的推廣和普及。在構造故障樹時要運用故障運算,在其未被一般分析人員充分掌握的情況下,很容易發生錯誤和失察。例如,很有可能把重大影響系統故障的事件漏掉;同時,由于每個分析人員所取的研究范圍各有不同,其所得結論的可信性也就有所不同。

故障樹分析圖通常用于說明可能會導致故障的事件,以防止故障的發生。故障樹分析圖通常用在 Six Sigma 進程中,特別用在 Six Sigma 業務改進進程的分析階段。? 繪制故障樹分析圖時,可從頂層事件(或故障)開始。然后,可以使用事件形狀和門形狀從上到下來說明可能導致故障的進程。完成該圖后,即可使用它來確定消除故障起因的方法,找到防止此類故障的糾正措施。?
事件符號底事件底事件是故障樹分析中僅導致其他事件的原因事件
圓形符號是故障樹中的基本事件,是分析中無需探明其發生原因的事件,基本事件符號,不能再往下分析的事件。
菱形符號是故障樹分析中的未探明事件,即原則上應進一步探明其原因但暫時不必或暫時不能探明其原因的事件.它又代表省略事件,一般表示那些可能發生,但概率值微小的事件;或者對此系統到此為止不需要再進一步分析的故障事件,這些故障事件在定性分析中或定量計算中一般都可以忽略不計,正常事件符號,正常情況下存在的事件。
矩形符號,是故障樹分析中的結果事件,可以是頂事件,由其他事件或事件組合所導致的中間事件和矩形事件的下端與故障門連接,表示該事件是故障門的一個輸入
頂事件是故障樹分析中所關心的結果事件
中間事件是位于頂事件和底事件之間的結果事件
特殊事件特殊事件指在故障樹分析中需用特殊符號表明其特殊性或引起注意的事件
房形符號是開關事件,在正常工作條件下必然發生或必然不發生的事件,當房形中所給定的條件滿足時,房形所在門的其它輸入保留,否則除去.根據故障要求,可以是正常事件,也可以是故障事件,省略事件,不能或不需要向下分析的事件。
扁圓形符號是條件事件,是描述故障門起作用的具體限制的事件
故障符號與門,表示B1、B2兩事件同時發生(輸入)時,A事件才發生(輸出)
或門,表示B1或B2任一事件單獨發生(輸入)時,A事件都可以發生(輸出)
非門表示輸出事件是輸入事件的對立事件
表決門表示僅當n個輸入事件中有k個或k個經上的事件發生時,輸出事件才發生
條件與門,表示B1、B2兩事件同時發生(輸入)時,還必須滿足條件a,A事件才發生(輸出)
條件或門,表示B1或B2任一事件單獨發生(輸入)時,還必須滿足條件a,A事件才發生(輸出)
限制門,表示B事件發生(輸入)且滿足條件a時,A事件才發生(輸出)
轉入符號,表示在別處的部分樹,由該處轉入(在三角形內標出從何處轉入)/ 轉出符號,表示這部分樹由該處轉移至其他處,由該處轉入(在三角形內標出向何處轉移)
相似轉移符號用以指明相似子樹的位置,轉向和轉此字母代號相同,事件的標號不同
(2)布爾代數與主要運算法則。
在故障樹分析中常用邏輯運算符號(·)、(+)將各個事件連接起來,這連接式稱為布爾代數表達式。在求最小割集時,要用布爾代數運算法則,化簡代數式。這些法則有:
①交換律 A·B=B·A
A+B=B+A
②結合律 A+(B+C)=(A+B)+C
A·(B·C)=(A·B)·C
③分配律 A·(B+C)=A·B+A·C
A+ (B·C)=(A+B)·(A+C)
④吸收律 A·(A+B)=A
A+A·B=A
⑤互補律 A+A′=Ω=1
A·A′=0
⑥冪等律 A·A=A
A+A=A
⑦狄摩根定律 (A+B)′=A′+B′
(A·B)′=A′+B′
⑧對合律 (A′)′=A
⑨重疊律 A+A′B=A+B=B′+BA
(3)故障樹的數學表達式。
為了進行故障樹定性、定量分析,需要建立數學模型,寫出它的數學表達式。把頂上事件用布爾代數表現,并自上而下展開,就可得到布爾表達式。
例如:有故障樹如圖1所示。

圖1 未經化簡的故障樹
未經化簡的故障樹,其結構函數表達式為:
T=A1+A2
=A1+B1B2B3
=X1X2+(X3+X4)(X3+X5)(X4+X5)
=X1X2+X3X3X4+X3X4X4+X3X4X5+X4X4X5+X4X5X5+X3X3X5+X3X5X5+X3X4X5
(4)最小割集的概念和求法。
①最小割集的概念。
能夠引起頂上事件發生的最低限度的基本事件的集合(通常把滿足某些條件或具有某種共同性質的事物的全體稱為集合,屬于這個集合的每個事物叫元素)。稱為最小割集。換言之:如果割集中任一基本事件不發生,頂上事件絕不會發生。一般割集不具備這個性質。例如本故障樹中{Xl,X2}是最小割集,{X3,X4,X3}是割集,但不是最小割集。
②最小割集的求法。
利用布爾代數化簡法,將上式歸并、化簡。
T=X1X2+X3X3X4+X3X4X4+X3X4X5+X4X4X5+X4X5X5+X3X3X5+X3X5X5+X3X4X5
=X1X2+X3X4+X3X4X5+X4X5+X3X5+X3X4X5
=X1X2+X3X4+X4X5+X3X5
得到4個最小割集{X1,X2}、{X3,X4}、{X4,X5}、{X3,X5}。
(5)最小割集的作用。
最小割集表明系統的危險性,每個最小割集都是頂上事件發生的一種可能渠道。最小割集的數目越多,系統越危險。現分述如下:
①表示頂上事件發生的原因。事故發生必然是某個最小割集中幾個事件同時存在的結果。求出故障樹全部最小割集,就可掌握事故發生的各種可能,對掌握事故的規律,查明事故的原因大有幫助。
②-個最小割集代表一種事故模式。根據最小割集,可以發現系統中最薄弱的環節,直觀判斷出哪種模式最危險,哪些次之,以及如何采取預防措施。
③可以用最小割集判斷基本事件的結構重要度,計算頂上事件概率。
3 故障樹建樹及原則
故障事件和基本事件是部件(設備和人都被看做部件)的故障表示。它分為故障破壞和故障。
部件的故障破壞是一個異常情況,它要求在正常功能重新恢復之前,必須進行修復。例如,當泵軸承斷裂,可視為故障破壞。而部件故障是一旦異常條件得到修正,它的功能即可以恢復。例如,開關受潮引起接觸故障。一旦干燥后,功能就正常了。
不論將部件異常劃分成為故障還是故障破壞,故障樹分析的基本假定都是把所有部件作為處于故障狀態或處于正常工作狀態來處理。通常,一系列演降(遞降)運行狀態的分析都是假設。分析人員必須確定故障樹中所有的事件“成立”或“不成立”。故障樹中故障和故障破壞可分為3種:①主故障和故障破壞;②副故障和故障破壞;③指令性故障和故障破壞。
“主故障破壞和故障”是指當部件在設計規定條件下,運行時發生的異常情況。例如,壓力容器在設計的壓力范圍的,有用焊接的缺陷,而產生破壞,這就是一個主故障破壞。主故障破壞和故障通常屬于故障部件本身的缺陷,不屬于某些外力或條件,即部件自身引起故障破壞或故障。
“副故障和故障破壞”指設備操作條件超出設計范圍引起的設備異常情況。例如,壓力容器由于其他系統故障或故障破壞,引起本壓力容器內部的壓力升高,且超過設計極限,引起破裂,這就是“副故障破壞”。“副故障”不是由設備自身缺陷引起的,而是由于某些外力或條件所致。
指令隆故障是部件的功能符合設計要求時,設備異常,由于部件功能未按要求它的操作被稱為異常。例如,溫度報警儀在工藝中,由于溫度傳感器故障未進行高溫報警,傳感器的故障是由于高溫時報警儀未響,那么,沒有采取必要的處理。指令故障和故障破壞不會對設備產生故障。
在故障樹中通常出現這3種故障和故障破壞,故障樹分析的主要任務之一就是識別導致故障事件發生的基本事件。這些事件是主要故障和故障破壞,識別對部件有責任的故障。次要和指令故障是中間事件,可以進一步由它的主要故障和故障破壞確定。
1)分析過程
為了確定問題,必須選取:
(1)一個頂上事件。
(2)分析的邊界條件。
這些邊界條件包括:
·系統本身邊界;
·解決問題的深度;
·初始條件;
·不允許的事件;
·現有的條件;
·其他假設。
頂上事件是事故(或不希望事件),它是故障樹分析的主題(這一事件一般是通過前期安全評價確定的)。就一個被破壞的系統或工廠而言,確定頂上事件應很嚴謹,因分析范圍太寬或頂上事件確定不當都會導致分析失效。例如,用“工廠火災”作為頂上事件,對故障樹分析來說太過籠統。代之以“在工藝氧化反應器正常運行中發生失控反應”作為頂上事件,就很恰當。因為它說清了“發生了什么事”、“在何處發生”、“何時發生”。“什么事”講清了事故的類型(失控反應),“何處”講清了事故發生的設備和系統(工藝氧化反應器),“何時”講清了整個系統當時的狀態(正常運行中)。
2)實物系統邊界條件
在故障樹中它包括:設備、設備與其他工藝的界面、公用/輔助系統。除了系統邊界,分析人員應列出故障樹事件的解決方案(應簡單說明在故障樹中的細節)。例如,電動閥可作為一個單一設備或作為幾個硬件條件(即閥體、類型、電動操作人員,必須的開關裝置、動力電源,閥破裂),安全研究的評價水平較高的人員在分析時,常從FMEA或預先分析中獲取故障詳細資料。對故障樹的求解只限于滿足分析主題的需要,并與已有的資料相適應(匹配)。
另一邊界條件是初始設備狀態和初始運行情況。這種邊界條件說明了故障樹分析的系統和設備(當時)狀況。對于實物體系邊界內的所有設備,分析人員都要給定其狀態,如哪個閥門是開的,哪個閥門是關的,哪個泵開,哪個泵關等。這些邊界條件說明系統是否處于正常或非正常狀態。
3)不允許事件
對于故障樹分析來說,不允許事件被認為是令人難以置信的,或因某種原因,它不在分析所考慮的范圍內,現有條件(也是故障樹分析的目的)是認為確實所發生的事件。在已發生的故障中通常不出現未允許事件或現有條件;但是作為編制故障樹結果,編制其他故障事件時它們的影響應考慮進去。
4)編制故障樹結構
故障樹結構由頂上事件開始,逐步展開直至找出基本事件。分析人員從頂上事件開始,逐步擴展到下一層,用推理法找出原因和影響,以確定引起頂上事件必須的有效原因的中間事件,用故障樹表示非常簡單,可用其他方法(像FMEA)來評價之。
與頂上事件有聯系的頂上事件的中間原因在故障樹中顯示出來。如果某一中間原因直接導致頂上事件發生,就用“或邏輯門”把它與頂上事件連接起來;如果需要所有中間原因同時存在才能發生頂上事件,則它們與頂上事件的連接是使用“與邏輯門”。頂上事件的所有中間事件用上述方式來處理。對每個中間事件,在故障樹中用相應的邏輯門確定;分析人員逐步擴展故障樹直至找出所有故障原因的基本事件。

為了提高故障樹編制方法的同一性和完備性,表1列出了幾種基本原則。這些基本規則強調系統地和規范地編制故障樹的重要性。
違背這些規則進行簡化,會導致故障樹不全面,雖然表面上是重要的故障組合。這類簡化還會限制故障樹的交流使用,因為只有編制該故障樹的人才能解釋其邏輯方式。
有了各基本事件的發生概率,就可計算頂上事件的發生概率。

本文為冠卓咨詢原創文字作品,任何人或組織不得對本文進行篡改,轉載或以盈利為目的行為,一經發現,將負法律責任。