特斯拉

計算處理器

Tesla GPU的20系列產品家族基於代號為“Fermi”的下一代CUDA架構,支持技術與企業計算所“必備”的諸多特性,其中包括C++支持、可實現極高精度與可擴展性的ECC存儲器以及7倍於Tesla 10系列GPU的雙精度性能。Tesla? C2050與C2070 GPU旨在重新定義高性能計算並實現超級計算的平民化。

介紹


與最新的四核CPU相比,Tesla C2050與C2070計算處理器以十分之一的成本和二十分之一的功耗即可實現同等超級計算性能。

特性


基於新一代Fermi CUDA架構的GPU與基於最新四核CPU的純CPU系統相比,該GPU以十分之一的成本和二十分之一的功耗即可實現同等的集群性能。
448個CUDA核心每顆GPU最高可實現515 Gigaflop雙精度峰值性能,從而讓一台工作站即可實現Teraflop級甚至更高的性能。每顆GPU的單精度峰值性能超過1 Teraflop。
ECC存儲器能夠滿足工作站計算精度與可靠性方面的關鍵需求。能夠為存儲器中的數據提供保護功能,從而為應用程序增強數據完整性和可靠性。寄存器文件、L1/L2高速緩存、共享存儲器以及DRAM均受ECC的保護。
台式機上的集群性能與一個小型伺服器集群相比,配備多顆GPU的單台工作站能夠更快地解決大型難題。
每顆GPU最多配備6GB GDDR5存儲器更大的數據集能夠保存在直接附屬於GPU的本地存儲器上,從而實現了性能的最大化並減少了數據傳輸的情況。
NVIDIA®;(英偉達?)并行DataCache?能夠為物理效果解算器、光線追蹤以及稀疏矩陣乘法等諸多演演算法加速,在這些演演算法中,數據地址事先都是未知的。每個流式多處理器模塊均包含一個可配置的L1高速緩存,所有處理器核心使用統一的L2高速緩存。
NVIDIA®;(英偉達?)GigaThread?引擎通過多項技術實現了吞吐量的最大化,其中包括10倍於上一代架構的高速上下文切換、併發內核執行以及改良的線程塊調度。
非同步傳輸計算核心在PCIe匯流排上傳輸數據的同時還能夠處理其它數據,因而增強了系統性能。即便是地震處理這類需要大量數據傳輸的應用程序,也能夠通過事先將數據傳輸至本地存儲器的方法來最大限度提升計算效率。
CUDA編程環境受到各種編程語言與API的廣泛支持開發人員無論選擇C語言、C++、OpenCL、DirectCompute還是選擇Fortran語言,都能夠實現應用程序的并行機制,進而利用“Fermi”GPU的創新架構。Microsoft Visual Studio開發人員可以使用NVIDIA®;(英偉達?)Parallel Nsight工具。
高速PCIe Gen 2.0數據傳輸率實現了主系統與Tesla處理器之間帶寬的最大化。讓Tesla系統能夠應用於幾乎所有具備一條開放式PCIe x16插槽且符合PCIe規範的主系統。

規格


尺寸規格9.75英寸PCIe x16規格
Tesla GPU的數量1
CUDA核心數量448
CUDA核心頻率1.15 GHz
雙精度浮點性能(峰值)515 Gflops
單精度浮點性能(峰值)1.03 Tflops
專用存儲器總容量*
Tesla C2050
Tesla C2070
3GB GDDR5
6GB GDDR5
存儲器頻率1.5 GHz
存儲器介面384位
存儲器帶寬144 GB/秒
功耗247W熱設計功耗
系統介面PCIe x16 Gen2
散熱解決方案主動式風扇散熱器
軟體開發工具
CUDA C/C++/Fortran、OpenCL以及DirectCompute工具包。
針對Visual Studio的NVIDIA®;(英偉達?)Parallel Nsight?