存儲陣列

存儲陣列

存儲陣列:由大量的存儲單元組成,每個存儲單元能存放1位二值數據(0,1)。通常存儲單元排列成N行×M列矩陣形式。它是把多個磁碟組成一個陣列,當作單一磁碟使用,它將數據以分段(striping )的方式儲存在不同的磁碟中,存取數據時,陣列中的相關磁碟一起動作,大幅減低數據的存取時間,同時有更佳的空間利用率。磁碟陣列所利用的不同的技術,稱為RAID level ,不同的level 針對不同的系統及應用,以解決數據安全的問題。

簡介


存儲陣列:由大量的存儲單元組成,每個存儲單元能存放1位二值數據(0,1)。通常存儲單元排列成N行×M列矩陣形式。
它是把多個磁碟組成一個陣列,當作單一磁碟使用,它將數據以分段(striping )的方式儲存在不同的磁碟中,存取數據時,陣列中的相關磁碟一起動作,大幅減低數據的存取時間,同時有更佳的空間利用率。磁碟陣列所利用的不同的技術,稱為RAID level ,不同的level 針對不同的系統及應用,以解決數據安全的問題。
一般高性能的磁碟陣列都是以硬體的形式來達成,進一步的把磁碟快取控制及磁碟陣列結合在一個控制器(RAIDControler )或控制卡上,針對不同的用戶解決人們對磁碟輸出/入系統的四大要求:
1)增加存取速度
2)容錯(fault tolerance ),即安全性
3)有效的利用磁碟空間
4)盡量的平衡CPU,內存及磁碟的性能差異,提高電腦的整體工作性能
延長存儲陣列壽命
在vSphere環境中,管理員使用SSD可以提升工作負載的性能,但是,你要知道你工作負載的需求,以防支出浪費。
SSD正在改變存儲。它們的低延遲、高吞吐量、價格適中結合在一起,使用SSD作為前端更大的緩存產生了一系列解決方案,這種便宜但是較慢。
SSD的一個最大特徵就是,它們的讀寫速度可以在幾十微妙內,比普通硬碟要快個幾百倍。這種低延遲讓SSD成為很棒的緩存技術。
昂貴的選擇
雖然價格持續下跌,SSD以低延遲、高吞吐量,以每千兆位元組為單位仍是一個高價格。如何經濟高效地使用這種昂貴類別的存儲,需要你擁有工作負載的知識。重要的是要有足夠的昂貴的緩存來支持應用程序性能。如果一個較大的緩存不能夠提供改進應用程序的性能的話,那就是浪費金錢。真正的問題是有幾個工具能夠用於識別你的應用程序的磁碟緩存大小。
在存儲歷史上,大多數存儲陣列都是使用硬碟作為存儲容量,將大量的硬碟和一些提高性能的RAM進行組合。最近,我們看到了一個新興的經濟型的全快閃記憶體存儲陣列——陣列里無硬碟——比同等價格的磁碟存儲提供更高的性能。這向許多客戶近年購買的磁碟存儲發起了挑戰。
從陣列中獲取最大利潤
存儲陣列的購買周期較長,一般都是3-5年。客戶想以更經濟的方式從他們的磁碟陣列上獲得更好的性能,這樣他們就可以避免過早的替代。磁碟陣列供應商添加SSD作為他們的磁碟陣列的性能層的緩存,以增加可用的RAM。在性能層訪問數據要比在磁碟層訪問數據快的多。在你的存儲陣列上調整SSD緩存和RAM的大小是優化存儲的一門新藝術。
中央緩存的概念就是指工作集的大小。應用程序通常訪問他們的一小部分數據要比訪問其他剩餘部分數據要頻繁的多得多。想要理解這一點,要把它想象成一本百科全書:閱讀每個頁面的索引要比閱讀其他任何頁多上幾百倍。有個全面的索引可得到上百倍的提升將會收益頗豐。而其他剩餘頁可得到上百倍的提升則收益很少。
在存儲陣列中對象大致是相同的。一小部分數據,被稱為熱點數據,也就是比其他數據訪問更頻繁的數據。緩存真正的好處,只有當我們有足夠的容量來容納所有訪問頻繁的頁面時才能體現出來。假如有10頁熱點數據,而緩存只能容納5頁,那麼我們就必須等待在較慢的介質上檢索其他5頁。有足夠的緩存來保存一些正常的頁面將會有所幫助,但是比不上緩存索引的速度。
計算合適的緩存大小
當SSD高速緩存能夠支撐設置的應用程序數據工作集是才最有價值。不能為工作集提供足夠的SSD將不能提供最佳的性能。假如一個應用程序有500GB數據。如果應用程序的I/O為40%,僅使用20GB數據,那麼顯然有一個20GB的緩存將會得到一個很好的改善。使40%的I/O提高百倍也是一個不錯的選擇。
那麼如果是100GB的緩存是否能提供更好的性能呢?有可能,但也不一定。也許應用程序下一個40%的I/O將傳輸200GB上下的數據。然而增加到100GB將不會提供與第一次20GB同樣水平的改善。額外的80GB緩存可能會加速只有15%的應用程序的I/O,將會花費最初改善四倍的成本。
挑戰熱點數據
最大的挑戰是熱點數據量難以衡量。甚至對於特定的應用程序類型,不同用途的應用程序——不同的用戶——將會有不同的概要文件。
熱點也有多個層次。那個百科全書,目錄表很小但使用要比索引多。而索引很大而且在所有頁面都設置很大。如果有一系列大量的緩存那些將會得到幫助;若緩存越大,有一系列層次的性能將會提升越多。也有一系列同層次的不隨緩存的增大而提高性能。如果你的性能層是SSD,非常昂貴,那麼你需要衡量你的工作負載,按你的工作量進行適量購買。
全快閃記憶體存儲陣列
雲的出現使虛擬化眾多工作負載,包括桌面變成了現實。但現在IT專業人員在大聲疾呼需要速度更快的網路存儲。
全快閃記憶體陣存儲陣列是存儲領域的法拉利。存儲陣列能夠交付高性能而且隨時準備通過消滅機械硬碟,引發存儲領域的革命。
網路存儲陣列面臨一連串的挑戰。用戶啟動虛擬桌面時,網路存儲陣列必須交付實例所需要的OS堆棧以及應用。理想情況下,這會立即完成。但如此眾多的新建實例批量出現—尤其是在虛擬桌面環境中—有時感覺就像是從軟盤引導。
全快閃記憶體存儲陣列能夠提供哪些幫助
全快閃記憶體存儲陣列能夠經受住啟動風暴並解決很多其他虛擬化性能問題。儘管存儲陣列設備很昂貴,但就單位成本而言其交付了最好的性能。存儲陣列規模各不相同,中等容量的存儲陣列能夠存儲大量桌面鏡像配置,並允許IT每小時引導數以千計的VDI實例,速度幾乎可以和本地存儲相媲美。
大容量單元迅速擴張給全快閃記憶體存儲陣列存儲帶來了另一個潛在的用例:存儲大數據的頂層網路存儲陣列。內存資料庫引擎以及基於GPU的系統對I/O要求都很高,如果網路I/O系統達不到要求,那麼很可能會使性能陷入瓶頸。PB級的全快閃記憶體存儲陣列能夠提供大數據所需要的大容量,而且也能滿足交付效率要求。PB級陣列成本也能接受,因為存儲陣列提供了後端重複數據刪除,原始成本低於2美元/GB。
全快閃記憶體存儲陣列的零售價也在不斷改進。3D NAND快閃記憶體的出現會促使其價格在明年進一步下降,進一步擴大了全快閃記憶體存儲陣列與舊有機械磁碟陣列之間的差異。技術繼續完善值得期待,全快閃記憶體存儲陣列的價格也會進一步降低。
存儲陣列容器扭轉敗局
有關虛擬化的一種新思維方式是隨時準備席捲雲。在每個存儲陣列虛擬桌面機器中封裝操作系統以及應用堆棧的舊方式導致了大量內存副本、過高的內存動態隨機訪問。每天早上當數百個微軟Windows以及Office副本交付給虛擬PC時同樣會導致啟動風暴。
存儲陣列容器技術正在改變這一切。存儲陣列容器仍舊處於早期階段,但存儲陣列容器模型避免了安裝多個操作系統及應用。存儲陣列容器只需要使用單個副本,但代價是靈活性有所降低,因為所有的虛擬機必須使用同樣的操作系統,但在雲中數以千計的鏡像幾乎是完全相同的,所以這並不是問題。
使用存儲陣列容器,每台伺服器載入單個操作系統鏡像,能夠派生出數百個虛擬存儲陣列桌面,以更低的代價達到更高的實例密度,存儲陣列同樣能夠受益於引導鏡像流量降低。
即使是這樣,將全快閃記憶體存儲陣列作為第一級存儲層仍具有重要意義,因為典型的存儲陣列容量應該朝PB級規模增長。某些廠商將不得不調整其產品定位,但供應低成本3D NAND快閃記憶體產品的廠商在競爭中將具備明顯的優勢。
存儲陣列打破競爭
在標準的SSD與專用全快閃記憶體存儲陣列之間進行權衡增加了另一個複雜的組合。採用SSD以及ARM處理器的小型設備與全快閃記憶體存儲陣列相比,在價格上更具優勢。SSD以及本地乙太網介面的崛起可能會進一步提升本地驅動器的優勢。
全快閃記憶體存儲陣列正在贏得比賽,但結果還不明朗。競爭很可能會變得激烈起來。如果想保持領先,那麼全快閃記憶體存儲陣列廠商不能維持現有價格或者固步自封。對用戶來說好消息是虛擬桌面將會變得更快、更便宜、更易於部署,啟動風暴最終會成為歷史。

應用


一個存儲陣列可能存在不同區域針對傳統硬碟和固態硬碟設備。存儲陣列這樣做有時是為了滿足不同的冷卻需求或功率密度。存儲陣列不當的混合磁碟類型可能導致氣流中斷,從而提升發熱量,縮短磁碟壽命。磁碟陣列性能受限於最慢的磁碟,所以在JBOD中盡量避免混合磁碟。存儲陣列使用單個類型的硬碟驅動器或SSD,或者嘗試匹配磁碟特徵,如旋轉速度。檢查陣存儲陣列的規範,禁止任何類型的磁碟或磁碟組合。
使用已經有認證平台的存儲陣列,例如,JBOD存儲陣列使用串列連接SCSI介面連接能夠報告單個磁碟/槽的磁碟狀態,存儲陣列允許管理員檢查JBOD陣列中的每個磁碟的情況。這將加速故障診斷速度,存儲陣列允許技術人員快速隔離和替換磁碟設備。