決策樹分析法
決策樹分析法
決策樹分析法是指分析每個決策或事件(即自然狀態)時,都引出兩個或多個事件和不同的結果,並把這種決策或事件的分支畫成圖形,這種圖形很像一棵樹的枝幹,故稱決策樹分析法。
一般都是自上而下的來生成的。每個決策或事件(即自然狀態)都可能引出兩個或多個事件,導致不同的結果,把這種決策分支畫成圖形很像一棵樹的枝幹,故稱決策樹。決策樹就是將決策過程各個階段之間的結構繪製成一張箭線圖,我們可以用下圖來表示。
選擇分割的方法有好幾種,但是目的都是一致的:對目標類嘗試進行最佳的分割。
從根到葉子節點都有一條路徑,這條路徑就是一條“規則”。
決策樹可以是二叉的,也可以是多叉的。
對每個節點的衡量:
1) 通過該節點的記錄數
2) 如果是葉子節點的話,分類的路徑
3) 對葉子節點正確分類的比例
有些規則的效果可以比其他的一些規則要好。
優點:
1) 可以生成可以理解的規則;
2) 計算量相對來說不是很大;
3) 可以處理連續和種類欄位;
4) 決策樹可以清晰的顯示哪些欄位比較重要。
缺點:
1) 對連續性的欄位比較難預測;
2) 對有時間順序的數據,需要很多預處理的工作;
3) 當類別太多時,錯誤可能就會增加的比較快;
4) 一般的演演算法分類的時候,只是根據一個欄位來分類。
決策樹是確定生產能力方案的一條簡捷的途徑。決策樹不僅可以幫助人們理解問題,還可以幫助人們解決問題。決策樹是一種通過圖示羅列解題的有關步驟以及各步驟發生的條件與結果的一種方法。近年來出現的許多專門軟體包可以用來建立和分析決策樹,利用這些專門軟體包,解決問題就變得更為簡便了。
決策樹由決策結點、機會結點與結點間的分枝連線組成。通常,人們用方框表示決策結點,用圓圈表示機會結點,從決策結點引出的分枝連線表示決策者可作出的選擇,從機會結點引出的分枝連線表示機會結點所示事件發生的概率。
在利用決策樹解題時,應從決策樹末端起,從後向前,步步推進到決策樹的始端。在向前推進的過程中,應在每一階段計算事件發生的期望值。需特別注意:如果決策樹所處理問題的計劃期較長,計算時應考慮資金的時間價值。
計算完畢后,開始對決策樹進行剪枝,在每個決策結點刪去除了最高期望值以外的其他所有分枝,最後步步推進到第一個決策結點,這時就找到了問題的最佳方案。
下面以南方醫院供應公司為例,看一看如何利用決策樹作出合適的生產能力計劃。
南方醫院供應公司是一家製造醫護人員的工裝大褂的公司。該公司正在考慮擴大生產能力。它可以有以下幾個選擇:1、什麼也不做;2、建一個小廠;3、建一個中型廠;4、建一個大廠。新增加的設備將生產一種新型的大褂,目前該產品的潛力或市場還是未知數。如果建一個大廠且市場較好就可實現$100,000的利潤。如果市場不好則會導致$90,000的損失。但是,如果市場較好,建中型廠將會獲得$ 60,000,小型廠將會獲得$40,000,市場不好則建中型廠將會損失$10,000,小型廠將會損失$5,000。當然,還有一個選擇就是什麼也不幹。最近的市場研究表明市場好的概率是0.4,也就是說市場不好的概率是0.6。參下圖:
在這些數據的基礎上,能產生最大的預期貨幣價值(EMV)的選擇就可找到。
EMV(建大廠)=(0.4)*($100,000)+(0.6)*(-$90,000)=-$14,000 EMV(中型廠)=(0.4) *($ 600,000))+(0.6)* (-$10,000)=+$18,000 EMV(建小廠)=(0.4)* ($40,000)+(0.6)*(-$5,000)=+$13,000 EMV(不建廠)=$0 根據EMV標準,南方公司應該建一個中型廠。