共找到11條詞條名為APU的結果 展開
APU
美國AMD公司研發的加速處理器
APU(Accelerated Processing Unit)中文名字叫加速處理器,是AMD“融聚未來”理念的產品,它第一次將中央處理器和獨顯核心做在一個晶片上,它同時具有高性能處理器和最新獨立顯卡的處理性能,支持DX11遊戲和最新應用的“加速運算”,大幅提升了電腦運行效率。
2011年1月,AMD推出了一款革命性的產品AMD APU,是AMD Fusion 技術的首款產品。
2011年6月面向主流市場的Llano APU正式發布。2012年10月,AMD發布Trinity系列晶元。AMD宣稱,Trinity筆記本電腦比英特爾晶元電腦便宜,但運行速度相當。Trinity運行速度比Llano快25%,圖形核心的運算速度快50%。
2013年6月AMD又推出全新一代APU,分別為至尊四核 Richland、經典四核Kabini和至尊移動四核Temashi,分別成為桌面版APU和移動版APU的最新領軍產品。
AMD於2014年推出了Kaveri系列APU,支持HSA異架構運算,使CPU與GPU協同工作,並使用28nm製程與GCN架構GPU,性能相較於前幾代APU而言達到了新的水準。
AMD在2013年還推出了PS4 APU 和 Xbox One APU,在性能上PS4 APU是Xbox One APU的1.5倍,是電腦 APU-7850k的5倍。
PS4的APU在性能上十分的強大,擁有1.84T/s浮點的GPU,以及176GB/s速度的8GB GDDR5共享內存,在性能上可以媲美中高端的電腦獨顯。
APU將通用運算x86架構CPU核心和可編程矢量處理引擎相融合,把CPU擅長的精密標量運算與傳統上只有GPU才具備的大規模并行矢量運算結合起來。AMD APU設計綜合了CPU和GPU的優勢,為軟體開發者帶來前所未有的靈活性,能夠任意採用最適合的方式開發新的應用。AMD APU通過一個高性能匯流排,在單個矽片上把一個可編程x86 CPU和一個GPU的矢量處理架構連為一體,雙方都能直接讀取高速內存。AMD APU中還包含其他一些系統成分,比如內存控制器、I/O控制器、專用視頻解碼器、顯示輸出和匯流排介面等。AMD APU的魅力在於它們內含由標量和矢量硬體構成的全部處理能力。
PS4 APU 的構架圖
因此,A系列的APU平台一般就稱為Llano APU平台,當然,也有人針對APU整合的GPU,把Llano APU平台叫做“Lynx平台”(猞猁平台)。
AMD認為,CPU和GPU的融合將分為四步進行:
X1 APU 的構架圖
第二步稱為平台優化(Optimized Platforms),CPU和GPU之間互連介面進一步增強,並且統一進行雙向電源管理,GPU也支持高級編程語言,這部分才是最關鍵的。
第三步是架構整合(Architectural Integration),實現統一的CPU/GPU定址空間、GPU使用可分頁系統內存、GPU硬體可調度、CPU/GPU/APU內存協同一致,這已在APU中初步完成。
第四步是架構和系統整合(Architectural & OS Integration),主要特點包括GPU計算環境切換、GPU圖形優先計算、獨立顯卡的PCI-E協同、任務并行運行實時整合等等,這些需要和微軟、ADOBE等行業軟體巨頭不停的溝通交流。
APU正是AMD公司對融合技術多年研究的成果,傳統計算中的絕大部分浮點操作都脫離CPU而轉入擅長此道的GPU部分,GPU不再只是遊戲工具,混合計算將大放光芒。在不遠的未來,CPU和GPU的概念也會漸漸模糊起來,正如AMD所宣傳的:The Future is Fusion。
最新RyzenAPU
Piledriver APU
HD Graphics 3000
至於電池續航能力,AMD內部測試給出的答案是:Windows桌面空閑待機12小時28分鐘、播放DVD標清電影7小時15分鐘、播放BD藍光高清電影4小時2分鐘、運行3DMark06測試3小時20分鐘。
Trinity APU還改進了DDR內存控制器,可以支持到DDR3-2133內存,從Llano APU的測試來看,內存性能的提升直接影響到圖形顯示部分的性能,從DDR3-1333內存升級為DDR3-1866后遊戲性能最高可提升55%。也許是由於修改部分較多,Trinity APU採用了新的FM2封裝介面,和FM1介面互不兼容。
這一代的Llano APU由於缺貨的原因目前並未發揮出它應有的能量——Fusion APU於2011年3月1日正式發布,主流的Llano APU於2011年6月1日正式發布,而在9月中下,隸屬A系列APU的A8-3850和A6-3650還並未在賣場鋪貨,起碼中關村賣場還未見到貨。在Sandy Bridge早早完成鋪貨並開始大勢宣傳的情況下,Llano APU還有多少的表現空間還不得而知,也許APU真正的能量在Trinity APU身上才能爆發出來。加強了整數運算性能的全新推土機架構處理核心和更側重通用計算的全新VLIW4架構圖形核心將使新一代Trinity APU具有更強的誘惑力,AMD首先提出的融聚概念的威力也將在那時候宣洩出來。
APU與融合
APU[美國AMD公司研發的加速處理器]
Llano APU的設計目標主要有這麼幾條:
- CPU、GPU性能綜合:同時提供最好的CPU、GPU性能。
- 獨立顯卡級別的GPU體驗:完整的DX11和功能集;拖拽轉碼和Aero效果等Windows 7體驗。
- 獨有雙顯卡技術:配合AMD Radeon獨立顯卡提供額外性能。
- 下一代視頻加速:也就是UVD3引擎,創新的顯示和畫質功能,更高帶寬。
- 行業和開放標準計算API支持:主要是OpenCL、DirectCompute,同時數據傳輸延遲更低。
- 3D立體:支持HD3D,包括藍光3D、DisplayPort 1.1(不及獨立顯卡的DP 1.2)、HDMI 1.4a。
可以看出,六個目標中有五個半是關於GPU的,涉及CPU的只有半個,Llano APU的關注重點也就不言而喻了,也與AMD VISION這樣的平台名字相符。
APU架構
從各方面看,首批發布的Llano APU都是採用了第一個完整版本,雙核版本也是由四核屏蔽而來的,因此熱設計功耗同樣較高。不知道何時才能看到原生的雙核版本,但是AMD透露說會在近期推出不需要風扇散熱的低功耗型號,想來就是了。
和之前的Brazos APU類似,Llano APU也在單獨一顆矽片上集成了以下眾多模塊:x86處理器核心、二級緩存、DDR3內存控制器、圖形SIMD陣列(也就是GPU)、顯示控制器、UVD解碼引擎、PCI-E控制器。從下邊這兩張圖上你就可以看出各個模塊的分佈位置和相對大小。
Llano APU內集成了如此眾多的功能模塊,如何確保它們之間的高速互連、以便讓整體隨時保持在最佳狀態、避免任何潛在的瓶頸,這無疑是APU設計過程中最關鍵的一點,也是獲得1+1>2效果的基本前提。AMD在這方面顯然是下足了功夫,比如特意設計了全新的Fusion Compute Link(Fusion計算連接)來將北橋模塊、GPU、IO輸入輸出串聯在一起,允許GPU訪問一致性緩存/內存,同時在GPU和北橋之間還搭建了Radeon Memory Bus(Radeon內存匯流排),讓沒有獨立顯存的GPU通過高速帶寬去訪問系統內存。
說到底,APU並不是簡簡單單地把CPU、GPU整合到一塊矽片上就完事了,不然也不會花費AMD三年多的時間,反覆修改設計才最終修成正果。
CPU與Turbo Core
Llano APU中的處理器部分來源於Stars架構,也就是俗稱的K10架構,與Phenom Ⅱ/Athlon Ⅱ系列同宗同源,在移動平台上更確切地說相當於此前的Phenom Ⅱ Mobile系列,自帶128-bit浮點單元、一級緩存(每核心64KB+64KB)、二級緩存(每核心1MB),但沒有三級緩存。
當然一切都不是完全照搬而來的。除了製造工藝從45nm進步到32nm,從而更有效地控制晶體管集成度、核心面積、頻率和功耗,支持C6電源狀態,還在細節上進行了大量優化,包括更大容量的二級緩存、改進的硬體預取、更大的窗口尺寸、硬體分割器、支持第二代Turbo Core智能超頻技術等等,最終將IPC(每時鐘周期指令數)提升了6%以上。
Turbo Core 2.0 介紹
我們知道,處理器在不同負載下的實際功耗差別很大,而且都距離最大熱設計功耗還有一定的空間,另一方面多核心處理器在不同應用環境中活躍的核心數量也有所不同,這都造成了處理器資源無法得到充分利用,形成了浪費。
解決方案就是由功耗監視器實時測量每個處理器核心的功耗,由北橋匯總,然後統一報告給P-State電源狀態管理器,再由其根據需要讓處理器的各個核心運行在適當的電源狀態下,或者降速或者提速,特別是提速的時候能短時間超過原始頻率,並且保證始終不超過整體熱設計功耗。
AMD Turbo Core的創新之處在於使用了數字式高級電源管理(APM)模塊,相比於類似技術中的模擬溫度和電流監測方法,能夠提供高靈敏度的電源管理,精確度更高,具備完全可重複性。
更關鍵的是,Turbo Core會自動協調CPU、GPU,讓需要更多資源的能夠獲得更高速度。在GPU閑置的時候,它就會大幅降低其頻率,去儘可能高地提升CPU頻率。
如果碰到了較為繁重的圖形或者視頻任務,GPU就會獲得更高優先順序,CPU退而求其次。
如果GPU執行的是DVD視頻播放等輕負載任務,那麼留給CPU的加速空間就要在整體熱設計功耗中排除掉GPU的那一部分。
極端情況下,如果CPU、GPU都面臨繁忙的任務,或者需要攜手進行OpenCL APP加速計算,此時CPU、GPU就會同時得到加速,甚至會在短時間內超過熱設計功耗限制,然後再根據情況去降低CPU的頻率和功耗(GPU不變),保證核心溫度不致於過高。這一點倒是和Sandy Bridge上的第二代Turbo Boost有些相似。
APU[美國AMD公司研發的加速處理器]
Llano APU的桌面版則支持雙通道DDR3 DIMM,每通道兩條內存條,總共可以插入四條內存,容量最大64GB,支持1.35V DDR3-1333、1.5V DDR3-1866,帶寬最高29.8GB/s。
由於CPU、GPU“同處一室”,難免會爭奪資源(事實上APU對內存帶寬的依賴性確實非常強),為此AMD將GPU與內存控制器之間的帶寬提高到了上代平台的四倍,且高於內存控制器與內存之間的帶寬。
DX11 GPU
這部分是Llano APU的重點。它 的 開發代號為“Sumo”(相撲),源於第一代DX11家族中Radeon HD 5600/5500系列的Redwood核心,最多400個流處理器、20個紋理單元、2個渲染後端、8個ROP單元,顯存位寬128-bit。遺憾的是,獨立的GDDR5顯存是沒有了,而且也不像880G主板那樣有板載硬顯存,只能去共享系統DDR3內存。
除了繼承原有的TeraScale 2統一處理架構,以及完全的DX11、OpenGL 4.1、各種抗鋸齒和各向異性過濾(包括形態抗鋸齒MLAA)、APP并行計算加速技術之外,Sumo核心還增加了來自Radeon HD 6000系列家族的UVD3視頻解碼引擎、功率門控(深度電源管理與節能),重新設計了通往北橋的顯存介面,製造工藝也同步採用了最新的GlobalFoundries 32nm。
Sumo核心自然還是VLIW5 5D式流處理器架構,單精度浮點計算性能最高480GFlops,整數計算性能最高480Gints,都是每秒鐘4800億次。
APU[美國AMD公司研發的加速處理器]
APU[美國AMD公司研發的加速處理器]
值得一提的是, Llano APU正式支持的OpenCL規範版本已更新至1.2。
晶元組與節能
APU[美國AMD公司研發的加速處理器]
APU[美國AMD公司研發的加速處理器]
A70M/A60M晶元組採用 65nm工藝製造,605球腳FC BGA封裝,晶元尺寸23×23=529平方毫米,典型熱設計功耗2.7-4.7W。
兩款晶元組均支持 六個SATA 6Gbps存儲介面並支持RAID 0/1陣列方式,可提供四條PCI-E 2.0 x1連接通道,集成時鐘發生器、消費級紅外接收器、風扇控制、電壓感應、DAC(支持VGA)等等,主要區別則在於USB介面: A70M原生支持四個USB 3.0、十個USB 2.0和兩個內部USB 1.1, A60M則沒有USB 3.0,而是改成了十四個USB 2.0。
這套平台上還有個可選的替補角色,那就是Vancouver Radeon HD 6000M系列獨立顯卡,通過PCI-E x16通道與處理器相連。它不但能為筆記本帶來獨顯性能,還支持與Llano APU集成的圖形核心組成雙顯切換、加速系統。
最後再說一下電源管理與節能技術,這方面同樣很豐富,包括32nm HKMG新工藝、AMD Turbo Core 2.0動態調速技術、系統管理模式(SMM)、ACIP兼容、多重性能狀態(P-states)、多重節能狀態(C-states)、S0/S3/S4/S5休眠狀態、每個核心功率門控(CC6)、PCI-E核心功率門控、Radeon流處理器核心與UVD3視頻引擎功率門控。
功率門控
以上種種,都屬於AMD AllDay全天計算技術。按照AMD給出的數據,ⅥSION 2010移動平台的待機時間最長為6個半小時,迎來了APU的ⅥSION 2011則可長達10個小時;同時相比競爭對手,待機續航時間長一個半多小時,滿載續航時間也要長一個小時。
Richland平台
Richland APU上的動態調頻技術為“Hybrid Boost”,晶元內部集成了更多的溫度感測器,並調整了Turbo加速的演演算法使之更加智能化。以前需要加速的時候往往是CPU和GPU同時加速,但是這種情況並不多見,現在的演演算法則能保證那個部分需要更強性能就加速哪個。
Virgo平台
移動平台為“Comal”,新一代APU採用GlobalFoundries 32nm SOI HKMG工藝製造,HD6000核心將被採用VLIW4(Cayman核心的HD6900就是採用的這種架構)架構的新圖形核心取代。
Trinity APU於2012年5月15日正式發布,它的主要任務是接替Llano成為新一代面向主流和高性能移動領域的融合處理器。它和Llano APU一樣最多擁有四個物理核心,不過核心架構從K10升級至Piledriver(打樁機,也就是第二代推土機),融合單顯部分則最多擁有384個DX 11 Radeon流處理器(升級至HD 6900系列的VLIW 4架構),所搭配的單晶元依然支持SATA 6Gbps、USB 3.0、PCI-E 2.0等規範,至於雙顯混合交火功能也是繼續支持的。
與上一代AMD APU相比,新一代的打樁機內核Trinity在性能上有著飛躍的提升,他的每一個運算模塊是由兩顆核心組成,每個模塊搭配2MB的緩存,打樁機提供了IPC improvement、leakage reduction、CAC reduction和frequency uplift等增強功能,這些有別於Llano的設計讓Trinity在性能上的發揮更為強大,性能提升將會非常明顯。在以往公布的APU機構途中,內存控制器、核心單元吞吐量和信息處理能力一直是重要提升項目,因為融合的原因,這些單項功能的提升將會大大提升AMD Trinity的實際應用性能。
Lynx平台
"Llano" (32 nm)
GPU部分基於Redwood核心
帶K字的型號開放倍頻
全型號通用參數:
晶體管數量:14.5億
核心面積:228平方毫米
步進:B0
介面:Socket FM1
UMI匯流排:5GT/s
註:GPU核心配置格式為:流處理器數量,紋理單元數量,光柵單元數量
型號 | 核心線程 | 主頻 | 加速頻率 | 二級緩存 | GPU型號 | GPU配置 | GPU頻率 | TDP | 內存支持 |
E2-3200 | 雙核心雙線程 | 2.4GHz | 無 | 2×512 KB | HD 6370D | 160:8:4 | 443MHz | 65W | DDR3-1600雙通道 |
A4-3300 | 雙核心雙線程 | 2.5GHz | 無 | 2×512 KB | HD 6410D | 160:8:4 | 443MHz | 65W | DDR3-1600雙通道 |
A4-3400 | 雙核心雙線程 | 2.7GHz | 無 | 2×512 KB | HD 6410D | 160:8:4 | 600MHz | 65W | DDR3-1600雙通道 |
A4-3420 | 雙核心雙線程 | 2.8GHz | 無 | 2×512 KB | HD 6410D | 160:8:4 | 600MHz | 65W | DDR3-1600雙通道 |
A6-3500 | 三核心三線程 | 2.1GHz | 2.4GHz | 3×1MB | HD 6530D | 320:16:8 | 443MHz | 65W | DDR3-1866雙通道 |
A6-3600 | 四核心四線程 | 2.1GHz | 2.4GHz | 4×1MB | HD 6530D | 320:16:8 | 443MHz | 65W | DDR3-1866雙通道 |
A6-3620 | 四核心四線程 | 2.2GHz | 2.5GHz | 4×1MB | HD 6530D | 320:16:8 | 443MHz | 65W | DDR3-1866雙通道 |
A6-3650 | 四核心四線程 | 2.6GHz | 無 | 4×1MB | HD 6530D | 320:16:8 | 443MHz | 100W | DDR3-1866雙通道 |
A6-3670K | 四核心四線程 | 2.7GHz | 無 | 4×1MB | HD 6530D | 320:16:8 | 443MHz | 100W | DDR3-1866雙通道 |
A8-3800 | 四核心四線程 | 2.4GHz | 2.7GHz | 4×1MB | HD 6550D | 400:20:8 | 600MHz | 65W | DDR3-1866雙通道 |
A8-3820 | 四核心四線程 | 2.5GHz | 2.8GHz | 4×1MB | HD 6550D | 400:20:8 | 600MHz | 65W | DDR3-1866雙通道 |
A8-3850 | 四核心四線程 | 2.9GHz | 無 | 4×1MB | HD 6550D | 400:20:8 | 600MHz | 100W | DDR3-1866雙通道 |
A8-3870K | 四核心四線程 | 3GHz | 無 | 4×1MB | HD 6550D | 400:20:8 | 600MHz | 100W | DDR3-1866雙通道 |
Athlon Ⅱ X4 631 | 四核心四線程 | 2.6GHz | 無 | 4×1MB | 無 | 無 | 無 | 100W | DDR3-1866雙通道 |
Athlon Ⅱ X4 651 | 四核心四線程 | 3GHz | 無 | 4×1MB | 無 | 無 | 無 | 100W | DDR3-1866雙通道 |
Comal平台
新一代APU採用GlobalFoundries 32nm SOI HKMG工藝製造,擁有2-4個基於改進的推土機架構CPU核心,核心代號為“Piledriver”,可以說這一部分的改進還是比較大的,因為上一代Llano的CPU部分還是採用的較老的K10架構,融合的GPU部分也進行了大刀闊斧的改進.
Brazos平台
基於Bobcat微架構
CPU支持:SSE,SSE2,SSE3,SSSE3,SSE4a,NX bit,AMD64,PowerNow!,AMD-V.
所有型號支持DX11和UVD3.0硬體解碼
Socket FT1介面
步進:B0,C0
註:GPU核心配置格式為:流處理器數量,紋理單元數量,光柵單元數量
型號 | 核心 | 主頻 | 二級緩存 | GPU型號 | GPU配置 | GPU頻率 | GPU加速頻率 | TDP | 內存支持 |
"Ontario" (40 nm) | |||||||||
C-30 | 單核心 | 1.2GHz | 512KB | HD 6250 | 80:8:4 | 276MHz | 無 | 9W | DDR3-1066單通道 |
C-50 | 雙核心 | 1GHz | 2×512 KB | HD 6250 | 80:8:4 | 276MHz | 無 | 9W | DDR3-1066單通道 |
C-60 | 雙核心 | 1GHz | 2×512 KB | HD 6290 | 80:8:4 | 276MHz | 400MHz | 9W | DDR3-1066單通道 |
"Zacate" (40 nm) | |||||||||
E-240 | 單核心 | 1.5GHz | 512KB | HD 6310 | 80:8:4 | 500MHz | 無 | 18W | DDR3-1066單通道 |
E-300 | 雙核心 | 1.3GHz | 2×512 KB | HD 6310 | 80:8:4 | 488MHz | 無 | 18W | DDR3-1333單通道 |
E-350 | 雙核心 | 1.6GHz | 2×512 KB | HD 6310 | 80:8:4 | 492MHz | 無 | 18W | DDR3-1066單通道 |
E-450 | 雙核心 | 1.65GHz | 2×512 KB | HD 6320 | 80:8:4 | 508MHz | 600MHz | 18W | DDR3-1333單通道 |
"Desna" (40nm) | |||||||||
Z-01 | 雙核心 | 1GHz | 2×512 KB | HD 6250 | 80:8:4 | 276MHz | 無 | 5.9W | DDR3-1066單通道 |
Sabine平台
"Llano" (32 nm)
CPU支持:MMX,SSE,SSE2,SSE3,SSE4a,Enhanced 3DNow!,NX bit,AMD64,Cool'n'Quiet,AMD-V,Turbo Core
CPU部分代號Husky,基於改進版K10.5架構
GPU部分基於Redwood核心
全型號通用參數:
晶體管數量:14.5億
核心面積:228平方毫米
步進:B0
介面:Socket FS1
UMI匯流排:2.5GT/s
註:GPU核心配置格式為:流處理器數量,紋理單元數量,光柵單元數量
型號 | 核心 | 主頻 | 加速頻率 | 二級緩存 | GPU型號 | GPU配置 | GPU頻率 | TDP | 內存支持 |
E2-3000M | 雙核心 | 1.8GHz | 2.4GHz | 2×512 KB | HD 6380G | 160:8:4 | 400MHz | 35W | DDR3-1333雙通道 |
A4-3300M | 雙核心 | 1.9GHz | 2.5GHz | 2×1MB | HD 6480G | 240:12:4 | 444MHz | 35W | DDR3-1333雙通道 |
A4-3305M | 雙核心 | 1.9GHz | 2.5GHz | 2×512 KB | HD 6480G | 240:12:4 | 593MHz | 35W | DDR3-1333雙通道 |
A4-3310MX | 雙核心 | 2.1GHz | 2.5GHz | 2×1MB | HD 6480G | 240:12:4 | 444MHz | 35W | DDR3-1333雙通道 |
A4-3320M | 雙核心 | 2GHz | 2.6GHz | 2×1MB | HD 6480G | 240:12:4 | 444MHz | 35W | DDR3-1333雙通道 |
A4-3330MX | 雙核心 | 2.2GHz | 2.6GHz | 2×1MB | HD 6480G | 240:12:4 | 444MHz | 45W | DDR3-1600雙通道 |
A6-3400M | 四核心 | 1.4GHz | 2.3GHz | 4×1MB | HD 6520G | 320:16:8 | 400MHz | 35W | DDR3-1333雙通道 |
A6-3410MX | 四核心 | 1.6GHz | 2.3GHz | 4×1MB | HD 6520G | 320:16:8 | 400MHz | 45W | DDR3-1600雙通道 |
A6-3420 | 四核心 | 1.5GHz | 2.4GHz | 4×1MB | HD 6520G | 320:16:8 | 400MHz | 35W | DDR3-1333雙通道 |
A6-3430MX | 四核心 | 1.7GHz | 2.4GHz | 4×1MB | HD 6520G | 320:16:8 | 400MHz | 45W | DDR3-1600雙通道 |
A8-3500M | 四核心 | 1.5GHz | 2.4GHz | 4×1MB | HD 6620G | 400:20:8 | 444MHz | 35W | DDR3-1333雙通道 |
A8-3510MX | 四核心 | 1.8GHz | 2.5GHz | 4×1MB | HD 6620G | 400:20:8 | 444MHz | 45W | DDR3-1600雙通道 |
A8-3520M | 四核心 | 1.6GHz | 2.5GHz | 4×1MB | HD 6620G | 400:20:8 | 444MHz | 35W | DDR3-1333雙通道 |
A8-3530MX | 四核心 | 1.9GHz | 2.6GHz | 4×1MB | HD 6620G | 400:20:8 | 444MHz | 45W | DDR3-1600雙通道 |
A8-3550MX | 四核心 | 2GHz | 2.7GHz | 4×1MB | HD 6620G | 400:20:8 | 444MHz | 45W | DDR3-1600雙通道 |