計算機集群

多台計算機協作完成任務的系統

計算機集群是一種計算機系統,它通過軟體或硬體把多台計算機以特殊的方式連接起來,協作完成指定的任務。

簡介


計算機集群簡稱集群是一種計算機系統,它通過一組鬆散集成的計算機軟體和/或硬體連接起來高度緊密地協作完成計算工作。在某種意義上,他們可以被看作是一台計算機。集群系統中的單個計算機通常稱為節點,通常通過區域網連接,但也有其它的可能連接方式。集群計算機通常用來改進單個計算機的計算速度和/或可靠性。一般情況下集群計算機比單個計算機,比如工作站或超級計算機性能價格比要高得多。

集群分類


集群分為同構與異構兩種,它們的區別在於:組成集群系統的計算機之間的體系結構是否相同。集群計算機按功能和結構可以分成以下幾類:
高可用性集群 High-availability (HA) clusters
負載均衡集群 Load balancing clusters
高性能計算集群 High-performance (HPC) clusters
網格計算 Grid computing

高可用性集群

一般是指當集群中有某個節點失效的情況下,其上的任務會自動轉移到其他正常的節點上。還指可以將集群中的某節點進行離線維護再上線,該過程並不影響整個集群的運行。

負載均衡集群

負載均衡集群運行時一般通過一個或者多個前端負載均衡器將工作負載分發到後端的一組伺服器上,從而達到整個系統的高性能和高可用性。這樣的計算機集群有時也被稱為伺服器群(Server Farm)。一般高可用性集群和負載均衡集群會使用類似的技術,或同時具有高可用性與負載均衡的特點。
Linux虛擬伺服器LVS)項目在Linux操作系統上提供了最常用的負載均衡軟體。

高性能計算集群

高性能計算集群採用將計算任務分配到集群的不同計算節點兒提高計算能力,因而主要應用在科學計算領域。比較流行的HPC採用Linux操作系統和其它一些免費軟體來完成并行運算。這一集群配置通常被稱為Beowulf集群。這類集群通常運行特定的程序以發揮HPC cluster的并行能力。這類程序一般應用特定的運行庫, 比如專為科學計算設計的MPI庫。
HPC集群特別適合於在計算中各計算節點之間發生大量數據通訊的計算作業,比如一個節點的中間結果或影響到其它節點計算結果的情況。

網格計算

網格計算或網格集群是一種與集群計算非常相關的技術。網格與傳統集群的主要差別是網格是連接一組相關並不信任的計算機,它的運作更像一個計算公共設施而不是一個獨立的計算機。還有,網格通常比集群支持更多不同類型的計算機集合。
網格計算是針對有許多獨立作業的工作任務作優化,在計算過程中作業間無需共享數據。網格主要服務於管理在獨立執行工作的計算機間的作業分配。資源如存儲可以被所有結點共享,但作業的中間結果不會影響在其他網格結點上作業的進展。

集群技術


1是通過多台計算機完成同一個工作。達到更高的效率。 2是兩機或多機內容、工作過程等完全一樣。如果一台死機,另一台可以起作用。

集群軟體


Sun Grid Engine