磁碟陣列櫃

由多種磁碟組合成的大型磁碟組

磁碟陣列簡稱RAID(Redundant Array of Independent Disks),有“獨立磁碟冗餘陣列”之意。磁碟陣列是由很多便宜、容量較小、穩定性較高、速度較慢磁碟,組合成一個大型的磁碟組,利用個別磁碟提供數據所產生的加成效果來提升整個磁碟系統的效能。同時,在儲存數據時,利用這項技術,將數據切割成許多區段,分別存放在各個硬碟上。磁碟陣列還能利用同位檢查(Parity Check)的觀念,在數組中任一顆硬碟故障時,仍可讀出數據,在數據重構時,將故障硬碟內的數據,經計算后重新置入新硬碟中。而磁碟陣列櫃就是裝配了眾多硬碟的外置的RAID 。

磁碟陣列櫃原理是利用數組方式來作磁碟組,配合數據分散排列的設計,提升數據的安全性。

設計挑戰


由於磁碟驅動器的技術以及傳輸介面的技術不斷的發展,磁碟陣列系統的設計隨時都面臨新的挑戰,以便符合與日俱增的要求。一個優質的磁碟陣列櫃,必須在設計階段,就要考慮到其規格必須符合更大容量、更高轉速磁碟驅動器的需求,提供:
穩定、高容量、容錯的電源供應系統
可靠、高性能、容錯的冷卻系統
能夠克服震動的機械結構
支持SCA2熱抽換接頭之被動背板
一體成型、無主動組件之磁碟載盒
數組櫃環境監控與警示功能
直接熱抽換且方便的維護操作功能
最佳的空間利用

滿足條件

1,磁碟驅動器以剛性方式固定於磁碟驅動器載盒〈不使用任何塑料或其它韌性支柱〉,塑料或其它韌性支柱會變成震動的放大器,讓磁碟驅動器震得更厲害。剛性方式固定,可以透過經由模態分析〈Model Analysis〉設計之陣列櫃,避開自然共振頻率〈Natural Resonance Frequency〉以及強迫共振頻率〈Forced Resonance Frequency〉,將系統震動降至最低,得到最佳性能,不會因震動造成磁頭偏移而需重新尋軌定位 (re-seek)。
2,磁碟驅動器載盒必須為一體成型之剛性合金製造,且緊密穩固地固定在機箱內。如果是以卡榫或螺絲方式接合,其防震效果可想而知,非常不理想。

電源供應系統

磁碟驅動器馬達啟動時,需要很大的啟動電流〈約2A〉,約為平常讀寫時〈約0.66A〉的3倍;磁碟驅動器在SEEK時,需要很大的瞬間電流〈約2.1A〉,約為讀寫時〈約0.66A〉之3倍。因此,電源供應系統必須能提供足夠、穩定之瞬間電流,否則會造成磁碟驅動器無法啟動,甚至造成數據寫入錯誤〈此為導致RAID磁碟驅動器被RAID控制器判定為Down,但磁碟驅動器送回原廠測試卻無故障之原因〉。當磁碟驅動器轉速越來越快,SEEK速度也越來越快時,電源供應器必須提供足夠的容量,以因應將來擴充的需求。
具備容錯,熱抽換、負載分享之雙電源供應器,是不可或缺的,更重要的是,如果電源供應器發生故障,要能不必下螺絲就能熱抽換電源供應〈使用螺絲起子解螺絲會造成震動及搖擺,會損害工作中之磁碟驅動器〉。
有了雙電源供應器,更要具備兩組電源輸入,一個接到市電,一個接到UPS。如此,無論突然斷電,或UPS故障,都不會造成RAID當機。
好的電源供應系統,還須具備交流電壓與頻率自動選擇及調整,以適用不同電壓及頻率,更重要的是,要能克服電壓及頻率不穩之狀況。在用電尖峰時段,市電電壓可能降到100伏特以下,而在非用電尖峰時段,市電電壓可能升到120伏特以上,因此電源供應系統必須能夠容忍這些電壓變化,提供磁碟驅動器穩定的電壓和電流,否則可能造成磁碟驅動器故障,甚至數據寫入錯誤。磁碟陣列櫃的電源供應系統,最好能夠提供從85到260伏特無段自動調整,如此,無論插到哪種插座,市電品質如何變化,都不會影響磁碟陣列的功能。

冷卻系統

在許多案例中,我們發現冷卻系統設計不完善的磁碟陣列櫃,只能裝設7200轉的磁碟驅動器,若使用10,000轉的磁碟驅動器,系統就會過熱。Seagate已經推出15,000轉的磁碟驅動器了,如何挑選一個具備可靠、高性能、容錯之冷卻系統的磁碟陣列櫃,就更顯得重要了。
一般磁碟陣列櫃之設計,在每個磁碟驅動器載具上加裝小風扇,整個系統再裝數個大風扇,用邊吸邊吹的方式散熱,不但散熱效果不好,而且是產生磁碟驅動器故障的潛在因素:它帶來的危害有以下這些:
產生大量氣流將粉塵吹入系統,污染磁碟驅動器及風扇本身造成故障。
採用一般PC用小風扇,且數量多(轉動機械零件越多,故障機率越高),系統可靠度因而巨幅降低。
一旦有一個小風扇故障,相關磁碟驅動器便無法獲得足夠散熱而故障。
一個優質磁碟陣列櫃之冷卻系統的設計,必須完全符合熱力學理論之全方位冷卻:熱傳導、熱對流及熱輻射之三相散熱方式,才能更有效率、可靠度更高:
磁碟驅動器載盒必須採用黑色、高導熱係數之金屬(如鋁合金),並與載盒緊密接觸固定,如此可以最快最有效地將磁碟驅動器之熱能傳導至整個載盒,然後以最大輻射面積與最佳輻射顏色(黑色),將熱能輻射至機體內空氣中,再以中央系統渦輪抽風機將熱空氣以對流方式排出
磁碟驅動器載盒不能使用風扇,及其它任何主動組件,以免本身故障而損及磁碟驅動器
系統採用中央抽風排熱設計,須使用兩個以上之工業用渦輪抽風機(不可用一般PC用風扇),以提高可靠度與排熱效率。由於工業用渦輪抽風機本身可以防止軸承被粉塵污染,且抽氣效率極高,可將機體內熱空氣抽出,並在機體內產生很大的相對低壓,冷空氣便可由經過精密設計之對流孔,均勻地進入機體內,達到最佳對流散熱效果。
中央系統渦輪抽風機必須具備熱抽換功能,且能夠自動溫控轉速,以達到最佳之排熱性能與能源使用效率只需一部渦輪抽風機就足以維持系統散熱之最低限度。工業用渦輪抽風機之出氣口面積只有一般PC用風扇1/10,因此即使有任何風扇因故停止運轉,也不致影響整個系統之熱對流結構。

防震機械結構

由於磁碟陣列的特性,當存取陣列中的數據時,陣列中所有的磁碟驅動器的磁頭,都幾乎在同時,往同一個方向SEEK,又幾乎同時在相同的位置煞車,其慣性動量非常之大。因此造成很大的震動問題。如果磁碟陣列櫃的機械結構不能克服這些震動問題,輕則造成Re-Seek,嚴重的話,會導致碟面受損,數據遺失。
一個好的磁碟陣列櫃的機械結構設計,必須克服上述震動問題:
磁碟驅動器以剛性方式固定於磁碟驅動器載盒(不使用任何塑料或其它韌性支柱):塑料或其它韌性支柱會變成震動的放大器,讓磁碟驅動器震得更厲害。剛性方式固定,可以透過經由模態分析設計之陣列櫃,避開自然共振頻率以及強迫共振頻率,將系統震動降至最低,得到最佳性能,不會因震動造成磁頭偏移而需重新尋軌定位(re-seek)。

被動背板

前面提到,磁碟陣列系統最重要的是可靠度,因此所有具備主動組件(包含電子組件和機械組件)都必須安裝在可熱抽換的模塊上,以便發生故障時可以隨時更換。一般來說,被動組件是不會壞的,除非暴力相向。
磁碟陣列櫃中,除了背板之外,其它所有模塊都可以是可熱抽換的。因此,背板上不可以有任何主動組件,以免有任一組件發生故障,必須停機更換,而且,一般來說,使用者是無法自行更換背板的。
磁碟陣列櫃背板的另一個重要規格,是必須使用SCA2接頭,以支持熱抽換。我們都知道,把磁碟驅動器從系統中拔出或插入,會造成很大的突波訊號,可能影響正在工作的Bus,甚至損壞磁碟驅動器介面組件,因此必須要有特殊的設計,來降低並防止突波可能造成的損害。
SCA2接頭的設計,是採用長、中、短等不同長度的接腳,將前期電源和地線、主電源、匯流排信號線等,依照先後順序接觸(插入)時或分離(拔出)時,如此可以將磁碟驅動器線路緩慢充電,將其電位提升以降低其與匯流排間之電位差,以減低突波訊號,保護電子介面組件以及避免干擾工作中的匯流排。

磁碟載盒

在實際的案例中,常發現用戶把磁碟載盒送修,因為磁碟載盒蜂鳴器一直叫、風扇卡住不轉了。當然,磁碟驅動器也可能因此而過熱,毀了。這就是磁碟載盒設計不良所造成的。
一個好的磁碟載盒設計,必須沒有使用任何可動機械或主動電子組件,亦即,不要有小風扇,也不要任何控制線路。如此,磁碟載盒本身就是金剛不壞之身,不會造成故障,更不會成為磁碟驅動器殺手。
同時,磁碟驅動器的固定方式,也是一門學問。除了前述要將磁碟驅動器直接且緊密地固定在磁碟載盒上,以達到熱傳導散熱之外,磁碟驅動器最好是倒掛式固定。如果採取一般正面式固定,則磁碟驅動器所產生的熱,傳導至磁碟載盒之後,又輻射出來產生熱空氣,再往上升,剛好用來烤磁碟驅動器的線路板和組件,會加速組件的老化。如果採取倒掛式固定,則傳導到磁碟載盒的熱,會輻射到磁碟驅動器上部空間,由對流氣流帶走,不會烘烤到磁碟驅動器線路組件。
為求達到最佳熱輻射散熱效果,磁碟驅動器載盒之表面,最好漆上黑色,因為黑色是最容易吸收熱能,也是最容易輻射出熱能的顏色。磁碟驅動器載盒的材質,必須具備高導熱係數的特性,如鋁合金辨識理想的材料,導熱係數高,加工也方便。
而如前述,磁碟驅動器載盒必須是一體成型的剛性金屬合金製造,以達到最佳震動克服性能。我們非常不建議採用組合式磁碟載盒,一般這些組合式磁碟載盒,都是由一個架子和一個盒子組成;架子上有風扇和熱抽換控制電路,固定在機殼上,再接Cable;磁碟驅動器則裝在盒子,透過轉接接頭連到架子上。如此,不但造成前述震動問題,而且一旦架子的風扇或電子組件故障,就必須停機更換。

監控示警功能

磁碟陣列櫃中所有主動組件或機械組件,以及內部環境溫度,都必須能夠監控且有適當的警示和通報功能:
陣列控制器必須能支持S.M.A.R.T.,以便預測可能發生的磁碟驅動器故障。妥善利用S.M.A.R.T.功能,能夠預先準備好備用磁碟驅動器,以便在第一時間把不穩的磁碟驅動器更換掉,如此可以把風險係數降至最低。
環境狀態監控器必須能隨時監視機櫃內部溫度,以及控制排設裝置轉速,以達到最佳冷卻及能源利用效率
電源供應器的輸入與輸出,也必須隨時監控。同時異常狀況必須以兩種以上方式通報,至少包含在數組櫃本身的聲音與視覺燈光警示,以及遠程通報。
另外,非常重要的一點是,環境監視控制器本身也是主動組件,也可能發生故障,因此,磁碟陣列櫃的環境監控器,必須能夠支持熱抽換功能。

維護操作功能

在磁碟陣列櫃中,所有可能發生故障的組件,包括主動電子組件、可動機械組件,都必須能夠支持熱抽換功能。不能抽換的組件,就必須是不會故障的被動組件。
具備可熱抽換功能,大家都知道,但是,要如何才能更方便、更安全地作熱抽換,可是一門學問。一個提供方便維護、安全熱抽換的磁碟陣列櫃,至少需具備以下功能:
所有可熱抽換的組件,都必須能由外部直接抽換,而不必先移除其它組件,如此才不會造成任何風險。試想,如果一個風扇壞了,你得先把一個電源供應器移除,才能抽換壞的風扇,你必須保證剩下那個電源供應器不會出問題,否則······
所有的熱抽換動作,都不需要將手或工具伸進機體內部,去拆解螺絲或拔接頭。把工具伸進機體內,可能誤觸線路造成短路,整個系統可能因此損壞或當機;把手伸入機體內,可能會觸電,人一觸電,反應是無法預期和控制的,可能會把整個磁碟陣列櫃甩到五公尺遠。
所有的熱抽換動作,都不需要使用任何工具。在操作中的系統上使用工具是非常危險的,用力轉螺絲會造成機體搖動,磁碟驅動器會受損;金屬工具也可能會造成短路。
所有可熱抽換的組件,都不可使用螺絲固定,因為如果不小心,螺絲很可能會掉進機體內,造成短路。如果一定要用螺絲,也要使用具有卡榫的螺絲,在解下后仍然能夠安全地卡在組件上,不會有脫落的危險。

空間利用

機架式系統中,空間的利用以及散熱氣流的需求,是非常重要的因素。同樣可容納七台磁碟驅動器,一個只要佔3U空間的磁碟陣列櫃,當然比一個要佔6U空間的磁碟陣列櫃要來得有效率。
要能達到最佳化的空間利用,除了磁碟陣列櫃的體積要小之外,散熱氣流的需求也是決定性因素。一個只應用到單向對流散熱方式的磁碟陣列櫃,需要很大的氣流需求才能達到散熱效果,因此即使體積小,也不能在一個機架中裝設太多磁碟陣列櫃,否則散熱氣流就會不夠。
如果磁碟陣列櫃採用高效率的三相散熱〈熱傳導、熱輻射、熱對流〉系統,就只需要小量的氣流,便足以發揮散熱效果,因此可以在機架中高密度地裝置磁碟陣列櫃,大大地提高空間使用效率,當然也大大地降低了成本。這對大型企業、ISP、以及主機代管業者來說,是非常有經濟效益的規格。

應用場所


由於磁碟陣列櫃具有數據存儲速度快、存儲容量大等優點,所以磁碟陣列櫃通常比較適合在企業內部的中小型中央集群網存儲區域進行海量數據存儲。