并行計算

并行計算

并行計算或稱平行計算是相對於串列計算來說的。它是一種一次可執行多個指令的演演算法,目的是提高計算速度,及通過擴大問題求解規模,解決大型而複雜的計算問題。所謂并行計算可分為時間上的并行和空間上的并行。時間上的并行就是指流水線技術,而空間上的并行則是指用多個處理器併發的執行計算。

定義


并行計算(Parallel Computing)是指同時使用多種計算資源解決計算問題的過程,是提高計算機系統計算速度和處理能力的一種有效手段。它的基本思想是用多個處理器來協同求解同一問題,即將被求解的問題分解成若干個部分,各部分均由一個獨立的處理機來并行計算。并行計算系統既可以是專門設計的、含有多個處理器的超級計算機,也可以是以某種方式互連的若干台的獨立計算機構成的集群。通過并行計算集群完成數據的處理,再將處理的結果返回給用戶。
并行計算可分為時間上的并行和空間上的并行。
時間上的并行:是指流水線技術,比如說工廠生產食品的時候步驟分為:
1. 清洗:將食品沖洗乾淨。
2. 消毒:將食品進行消毒處理。
3. 切割:將食品切成小塊。
4. 包裝:將食品裝入包裝袋。
如果不採用流水線,一個食品完成上述四個步驟后,下一個食品才進行處理,耗時且影響效率。但是採用流水線技術,就可以同時處理四個食品。這就是并行演演算法中的時間并行,在同一時間啟動兩個或兩個以上的操作,大大提高計算性能。
l 空間上的并行:是指多個處理機併發的執行計算,即通過網路將兩個以上的處理機連接起來,達到同時計算同一個任務的不同部分,或者單個處理機無法解決的大型問題。
比如小李準備在植樹節種三棵樹,如果小李1個人需要6個小時才能完成任務,植樹節當天他叫來了好朋友小紅、小王,三個人同時開始挖坑植樹,2個小時后每個人都完成了一顆植樹任務,這就是并行演演算法中的空間并行,將一個大任務分割成多個相同的子任務,來加快問題解決速度。

特徵


為利用并行計算,通常計算問題表現為以下特徵:
(1)將工作分離成離散部分,有助於同時解決;
(2)隨時並及時地執行多個程序指令;
(3)多計算資源下解決問題的耗時要少於單個計算資源下的耗時。

基本體系結構


并行計算科學中主要研究的是空間上的并行問題。從程序和演演算法設計人員的角度來看,并行計算又可分為數據并行和任務并行。一般來說,因為數據并行主要是將一個大任務化解成相同的各個子任務,比任務并行要容易處理。
空間上的并行導致了兩類并行機的產生,按照Flynn的說法分為:單指令流多數據流(SIMD)和多指令流多數據流(MIMD)。我們常用的串列機也叫做單指令流單數據流(SISD)。MIMD類的機器又可分為以下常見的五類:并行向量處理機(PVP)、對稱多處理機(SMP)、大規模并行處理機(MPP)、工作站機群(COW)、分散式共享存儲處理機(DSM)。

訪存模型

并行計算機有以下五種訪存模型:
均勻訪存模型(UMA)
非均勻訪存模型(NUMA)
全高速緩存訪存模型(COMA)
一致性高速緩存非均勻存儲訪問模型(CC-NUMA)
非遠程存儲訪問模型(NORMA)。

計算模型

并行求解過程示意圖
并行求解過程示意圖
不像串列計算機那樣,全世界基本上都在使用馮·諾伊曼的計算模型;并行計算機沒有一個統一的計算模型。不過,人們已經提出了幾種有價值的參考模型:PRAM模型,BSP模型,LogP模型,C^3模型等。

網路設置


并行計算機是靠網路將各個處理機或處理器連接起來的,一般來說有以下幾種方式:處理單元間有著固定連接的一類網路,在程序執行期間,這種點到點的鏈接保持不變;典型的靜態網路有一維線性陣列、二維網孔、樹連接、超立方網路、立方環、洗牌交換網、蝶形網路等。靜態連接

動態連接


用交換開關構成的,可按應用程序的要求動態地改變連接組態;典型的動態網路包括匯流排、交叉開關和多級互連網路等。

基本術語


節點度:射入或射出一個節點的邊數。在單向網路中,入射和出射邊之和稱為節點度。
網路直徑:網路中任何兩個節點之間的最長距離,即最大路徑數。
對剖寬度:對分網路各半所必須移去的最少邊數。
對剖帶寬:每秒鐘內,在最小的對剖平面上通過所有連線的最大信息位(或位元組)。

性能度量


基本指標

執行時間
工作負載
存儲性能

加速比評測

Amdahl定理
Gastofson定理
Sun-Ni定理

可擴放性標準

等效率標準
等速度標準
平均延遲標準
并行計算與雲計算
雲計算是在并行計算之後產生的概念,是由并行計算髮展而來,兩者在很多方面有著共性。學習并行計算對於理解雲計算有很大的幫助。并行計算是學習雲計算必須要學習的基礎課程。
但并行計算不等於雲計算,雲計算也不等同并行計算。兩者區別如下。
(1)雲計算萌芽於并行計算
雲計算的萌芽應該從計算機的并行化開始,并行機的出現是人們不滿足於CPU摩爾定率的增長速度,希望把多個計算機並聯起來,從而獲得更快的計算速度。這是一種很簡單也很樸素的實現高速計算的方法,這種方法後來被證明是相當成功的。
(2)并行計算、網格計算只用於特定的科學領域,專業的用戶
并行計算、網格計算的提出主要是為了滿足科學和技術領域的專業需要,其應用領域也基本限於科學領域。傳統并行計算機的使用是一個相當專業的工作,需要使用者有較高的專業素質,多數是命令行的操作,這是很多專業人士的噩夢,更不用說普通的業餘級用戶了。
(3)并行計算追求的高性能
在并行計算的時代,人們極力追求的是高速的計算、採用昂貴的伺服器,各國不惜代價在計算速度上超越他國,因此,并行計算時代的高性能機群是一個“快速消費品”,世界TOP500高性能計算機地排名不斷地在刷新,一台大型機群如果在3年左右不能得到有效的利用就遠遠的落後了,巨額投資無法收回。
(4)雲計算對於單節點的計算能力要求低
而雲計算時代我們並不去追求使用昂貴的伺服器,我們也不用去考慮TOP500的排名,雲中心的計算力和存儲力可隨著需要逐步增加,雲計算的基礎架構支持這一動態增加的方式,高性能計算將在雲計算時代成為“耐用消費品”。