RV770
RV770
RV770 GPU核心是地球上第一顆單晶元突破1萬億次單精度浮點運算能力、單晶元突破2000億次雙精度浮點運算能力的電腦晶元。AMD(ATI)公司在2008年第三季度發布的RV700系列中的中端核心架構(當時的AMD主攻中端市場因而並沒有拿出高端晶元)該晶元就是 AMD RADEON HD4850、HD4870顯卡的核心。
RV770雖是中端晶元,但運算能力卻勝過當時的NVIDIA頂級的G200核心,更令人震撼的是RV770實現如此強大的浮點運算能力僅僅集成了9.56億個晶體管,而當時的G200核心則集成了14億個晶體管。簡單地說,RV770擁有更好的性能、更低的功耗、更低的發熱量、以及更高的良品率。
運算能力對比
AMD RV770 單精度浮點運算能力為 1000 GFLOPs 、1200 GFLOPs
AMD RV770 雙精度浮點運算能力為 200 GFLOPs、 240 GFLOPs
NVIDIA G200 單精度浮點運算能力為 933 GFLOPs
NVIDIA G200 雙精度浮點運算能力為 116 GFLOPs
NVIDIA G92 單精度浮點運算能力為 432GFLOPs
NVIDIA G92 雙精度浮點運算能力為 54GFLOPs
NVIDIA G80 單精度浮點運算能力為 384GFLOPs
NVIDIA G80 雙精度浮點運算能力為 48GFLOPs
由上表可見,AMD RV770在運算能力方面擁有絕對的優勢,因此由國防科技大學裝配的中國的超級計算機 天河一號就採用了2560張AMD HD4870X2顯卡,也就是5120個RV770核心來構建了這台曾經是2010年亞洲第一、世界第五的超級計算機。(超級計算機排名每年都有變動)
AMD RV770核心架構圖
1.SIMD陣列擴充為10組,是原來的RV670的2.5倍,流處理器數量也由320個增加到800個。而且每組SIMD還綁定了專屬的緩存及紋理單元,寄存器的容量也有所增加,紋理單元相應增加到10組,總數達到40個。
2.RV770的全屏抗鋸齒能力大幅增強。RV770還是保持4組后處理單元,也就是通常所說的16個ROPs(光柵單元),但AMD重新設計了光柵單元的內部結構,改善了之前較弱的AA反鋸齒性能。R600/670每組后處理單元內部包括了8個Z模板採樣,而RV770則提高到16個,因此它的多重採樣(MSAA)速度幾乎可以達到以前的2倍。當然,RV770的反鋸齒演演算法最終還是要由Shader來處理,而RV770的800個流處理器正好可以派上用場,最終抗鋸齒性能有不小的提升。
3.RV770可以依靠800的流處理器的處理能力輕鬆突破1TFlop的浮點運算能力。成為第一款成功達到1TFlop的GPU核心,這是顯卡史上具有里程碑意義的突破。
4.開源的GPGPU功能。NVIDIA所倡導的CUDA在科學計算領域取得了不小的成功,但是,CUDA並非一個完全免費的開放API,支持它的應用軟體實際上都需要重新編譯,這明顯會加大軟體生產商的研發成本。與此同時,AMD與蘋果公司一起推廣的通用計算行業的新一代標準API——OpenCL,旨在讓GPU能與多核CPU互相協調工作,以提高系統的整體計算能力。未來這一標準將是公開而免費的。
5.內建第二代UVD視頻解碼引擎。相對於第一代UVD技術而言,主要在以下有所改進。1.更好地支持超高碼率的視頻編碼與播放。2.支持2160P及更高解析度視頻編碼。3.支持多流解碼,即可同時解碼多部高清影片,比NVIDIA在GTX280上實現的雙流解碼更強大。4.繼續內置高清音頻模塊並可以通過HDMI介面輸出7.1聲道的AC3和DTS編碼音頻流。
6.業界率先採用55nm製造工藝的GPU核心,使晶圓成本得以降低,以控制成本,同時,55nm製程的熱功耗設計比此前的顯卡更出色,可以有效的降低發熱量和提高超頻能力。
7.RV770支持DirectX 10.1。DX10.1改善了Shader資源存取功能,在進行多樣本反鋸齒時間少了性能損失。它還能夠提高新遊戲的陰影過濾效率,進一步提高光影效果。此外DX10.1還支持32位浮點過濾,能夠提高渲染精度,改善HDR畫質。
AMD(ATI)Radeon HD4830
AMD(ATI)Radeon HD4850
AMD(ATI)Radeon HD4870
AMD(ATI)Radeon HD4850X2
AMD(ATI)Radeon HD4870X2
HD4850
核心代號:RV770
顯卡核心頻率:625MHz
流處理器頻率: 625MHz
顯卡核心工藝:55納米
核心生產廠商:AMD(ATI)
晶體管數目: 9.56億
顯存類型:GDDR3
紋理單元:40
光柵單元:16
顯存封裝:FBGA
顯存頻率:1986MHz
顯卡顯存容量:512MB
顯存位寬:256bit
流處理單元:800個
介面類型: PCI Express X16 2.0
最大解析度:2560×1600
3D API :DirectX 10.1, Shader Model 4.1, OpenGL 2.0
HD4870
核心代號:RV770XT
顯卡核心頻率: 750MHz
顯卡核心工藝:55納米
核心生產廠商:AMD(ATI)
晶體管數目: 9.56億
顯存類型:GDDR5
顯存封裝:FBGA
顯存頻率:3600MHz
顯卡顯存容量:512MB
顯存位寬:256bit
流處理單元:800個
介面類型: PCI Express X16 2.0
最大解析度:2560×1600
3D API :DirectX 10.1, Shader Model 4.1, OpenGL 2.0
多卡技術:CrossFireX
多卡技術:CrossFireX
HD4850X2
核心代號:RV770
顯卡核心頻率:625MHz
流處理器頻率: 625MHz
顯卡核心工藝:55納米
核心生產廠商:AMD(ATI)
晶體管數目: 9.56億*2
顯存類型:GDDR3
紋理單元:40*2
光柵單元:16*2
顯存封裝:FBGA
顯存頻率:1986MHz
顯卡顯存容量:512MB *2
顯存位寬:256bit *2
流處理單元:800個 *2
介面類型: PCI Express X16 2.0
最大解析度:2560×1600
3D API :DirectX 10.1, Shader Model 4.1, OpenGL 2.0
HD4870X2
核心代號:RV770XT
顯卡核心頻率: 750MHz
顯卡核心工藝:55納米
核心生產廠商:AMD(ATI)
晶體管數目: 9.56億*2
顯存類型:GDDR5
顯存速度:0.5ns
顯存封裝:FBGA
顯存頻率:3600MHz
顯卡顯存容量:512MB *2
顯存位寬:256bit *2
光柵單元:16*2
流處理單元:800個 *2
介面類型: PCI Express X16 2.0
最大解析度:2560×1600
3D API :DirectX 10.1, Shader Model 4.1, OpenGL 2.0
多卡技術:CrossFireX