層次聚類試圖在不同層次對數據集進行劃分,從而形成樹形的聚類結構。數據集劃分可採用“自底向上”的聚合策略,也可採用“自頂向下”的分拆策略。
樹的最底層有5個聚類,在上一層中,聚類6包含數據點1和數據點2,聚類7包含數據點4和數據點5。隨著我們自下而上遍歷樹,聚類的數目越來越少。由於整個聚類樹都保存了,用戶可以選擇查看在樹的任意層次上的聚類。
層次聚類是另一種主要的聚類方法,它具有一些十分必要的特性使得它成為廣泛應用的聚類方法。它生成一系列嵌套的聚類樹來完成聚類。單點聚類處在樹的最底層,在樹的頂層有一個根節點聚類。根節點聚類覆蓋了全部的所有數據點。
合併(自下而上)聚類
分裂(自上而下)聚類