原生四核處理器

原生四核處理器

四核處理器已經成為目前智能手機的最頂級配置,包括三星、HTC、魅族都已經推出了相關機型,其他廠商也在跟進,比如天語。其實天語在國產廠商中的風格可以說是比較激進,在雙核時代便早早發布W700,只是由於和阿里雲合作進程的關係,遲遲未能上市最終錯失市場先機。而之後推出的“大黃蜂”、“小黃蜂”等機型即使售價較低,但用戶口碑卻褒貶不一,也與搭載阿里雲OS有關。那麼,傳說中售價低於3000元的四核智能機“大黃蜂2(型號為V8)”,是否仍舊是一款“淘寶系”手機呢?今天騰訊數碼頻道便為大家揭曉,首先來看看天語大黃蜂2的主要配置信息。

綜述


原生四核處理器不同於普通的四核處理器,具有更為強大的運算速度和性能
普通的四核處理器僅僅是將兩個雙核處理器封裝在一起的所謂“粘合”,戲稱“膠水四核”
而原生四核處理器是純粹的單片電路四核處理器,意味著每顆處理器中包含4顆單獨的微處理器內核,使得整個處理器能更有效率的運行
由於不同公司之間架構的不相同,原理也不同程度的差異
以下,我將分IntelAMD兩家公司所推出的原生四核處理器做一個詳細的解釋與闡釋

Intel


Intel的第一款原生四核處理器是於2008年推出的64位四內核CPU——Core i7(中文:酷睿i7,內核代號:Bloomfield),沿用I7 920x86-64指令集,並以Intel Nehalem微架構為基礎,取代Intel Core 2系列處理器。

參數

1. 基於Nehalem微架構
2. 2-8顆核心。
3. 內置三通道DDR3內存控制器
4. 每顆核心獨享256KB二級緩存。
5. 8 MB共享三級緩存。
6.SSE 4.2指令集(七條新指令)。
7.超線程技術。
8. Turbo mode(自動超頻)。
9. 微架構優化(支持64-bit模式的宏融合,提高環形數據流監測器性能,六個數據發射埠等等)
10. 提升預判單元性能,增加第二組分支照準緩存。
11. 第二組512路的TLB。
12. 對於非整的SSE指令提升性能。
13. 提升虛擬機性能(根據Intel官方數據顯示,Nehalem相對65nm Core 2在雙程虛擬潛伏上有60%的提升,而相對45nm Core 2產品提升了20%)
14. 新的QPI匯流排。
15. 新的能源管理單元。
16. 45nm製程,32nm製程產品隨後上線,代號Westmere。
17. 新的1366針腳介面。

新增功能

Nehalem相當於65nm產品有著如下幾個最重要的新增功能
1.SSE4.1指令集(47個新SSE指令)。
2. 深層休眠技術(C6級休眠,只在移動晶元上使用)。
3. 加強型Intel動態加速技術(只在移動晶元上使用)。
4. 快速Radix-16分頻器和Super Shuffle engine,加強FPU性能
5. 加強型虛擬技術,虛擬機之間交互性能提升25%-75%。

Core i7的改進

原生四核+全新緩存設計+有八個邏輯內核
我們知道,Core 2 Quad系列四核處理器其實是把兩個Core 2 Duo處理器封裝在一起,並非原生的四核設計,通過狹窄的前端匯流排FSB來通信,這樣的缺點是數據延遲問題比較嚴重,性能並不盡如人意。Core i7則採用了原生四核設計,採用先進的QPI(QuickPath Interconnect,下面將進行介紹)匯流排進行通訊,傳輸速度是FSB的5倍。
緩存方面也採用了三級內含式Cache設計,L1的設計和Core微架構一樣;L2採用超低延遲的設計,每個內核256KB(256x4 KB);L3採用共享式設計,被片上所有內核共享,容量為8MB。
採用全新QPI匯流排
Core i7的Nehalem架構最大的改進在前端匯流排(FSB)上,傳統的并行傳輸方式被徹底廢棄,轉而採用基於PCI Express串列點對點傳輸技術的通用系統介面(CSI),被Intel稱為QuickPath。QuickPath的傳輸速率為6.4GT/S,這樣一條32bit的QuickPath帶寬就能達到25.6GB/sec。QuickPath的傳輸速率是FSB 1333MHz的5倍,前者雖然數據位寬較窄,但傳輸帶寬仍然是後者的2.5倍。由於分別用於雙處理器和單處理平台,Gainestown有兩條QuickPath,而Bloomfield僅有一條。不難看出,在AMD推出HyperTransport高速串列匯流排,並逐漸在高性能運算領域建立優勢之後,Intel也迎頭趕上。若干年前,關於串列傳輸將一統天下的預言已經變成了現實,我們所要等待的是串列內存何時重返市場。
集成內存控制器
內存控制器相信大家不會感到陌生,競爭對手AMD早在K8時代CPU已經集成了內存控制器,能大幅提升內存性能,而Intel方面則表示由於時機還不合適,因此沒有在Core2中使用,現在最新的Core i7終於擁有集成內存控制器IMC(Integrated Memory Controller),可以支持三通道的DDR3內存,運行在DDR3-1333,內存位寬從128位提升到192位,這樣總共的峰值帶寬就可以達到32GB/s,達到了Core 2的2-4倍。處理器採用了集成內存控制器后,它就能直接與物理存儲器陣列相連接,從而極大程度上減少了內存延遲的現象。
同步多線程技術
超線程技術(Hyper-Threading),最早出現在130nm的Pentium 4上,超線程技術就是利用特殊的硬體指令,把兩個邏輯內核模擬成兩個物理晶元,讓單個處理器都能使用線程級并行計算,進而兼容多線程操作系統和軟體,減少了CPU的閑置時間,提高的CPU的運行效率。超線程技術使得Pentium 4單核CPU也擁有較出色的多任務性能,現在通過改進后的超線程技術再次回歸到Core i7處理器上,新命名為同步多線程技術(Simultaneous Multi-Threading,SMT)。
同步多線程(Simultaneous Multi-Threading,SMT)是2-way的,每核心可以同時執行2個線程。對於執行引擎來說,在多線程任務的情況下,就可以掩蓋單個線程的延遲。SMT功能的好處是只需要消耗很小的核心面積代價,就可以在多任務的情況下提供顯著的性能提升,比起完全再添加一個物理核心來說要划算得多。比起Pentium 4的超線程技術(Hyper-Threading),Core i7的優勢是有更大的緩存和更大的內存帶寬,這樣就更能夠有效的發揮多線程的作用。按照INTEL的說法,Nehalem的SMT可以在增加很少能耗的情況下,讓性能提升20-30%。
為什麼Core 2沒有使用SMT?很顯然,它是可以做到的。SMT是在節省電力的基礎上增加了性能,而且軟體支持的基礎建設也早就有了。有2個可能的原因:一是Core 2可能沒有足夠的內存帶寬和CPU內部帶寬來利用SMT獲得優勢。通常,SMT能夠提升內存級并行(memory level parallelism,MLP),但是對於內存帶寬已經成為瓶頸的系統則是個麻煩。而更有可能的原因則是SMT的設計、生效等是很麻煩的,而當初設計SMT是由INTEL的Hillsboro小組主持,而並非是Haifa小組(Core 2是由這個小組負責的)。這樣Core 2不使用SMT就避免了冒險。
自動超頻,核心加速
Turbo Mode,顧名思義,就是加速模式,它是基於Nehalem架構的電源管理技術,通過分析當前CPU的負載情況,智能地完全關閉一些用不上的核心,把能源留給正在使用的核心,並使它們運行在更高的頻率,進一步提升性能;相反,需要多個核心時,動態開啟相應的核心,智能調整頻率。這樣,在不影響CPU的TDP情況下,能把核心工作頻率調得更高。
舉個簡單的例子,如果遊戲只用到一個核心,Turbo Mode就會把其他三個核心自動關閉,把正在運行遊戲的那個核心的頻率提高,也就是自動超頻,在不浪費能源的情況下獲得更好的性能。Core 2時代,即使是運行只支持單核的程序,其他核心仍會全速運行,得不到性能提升的同時,也造成了能源的浪費。
Turbo Boost默認是開啟的,通過自動調高CPU的倍頻提高性能。在Intel原廠X58主板上,低負載時默認調高1-2個倍頻。例如Core i7 920默認頻率為2.66G,在Turbo Boost默認是開啟的情況下,運行Super PI是以單核2.8G來跑,這樣單線程性能也就得到提升。
超頻愛好者也許會想到,Turbo Mode自動提升的那個頻率可以手動調整嗎?如果可以,不就能利用它進行超頻嗎?答案是可以的,只要是Exterme Edition CPU,就可以手動調整,好好利用,新的超頻方式從此誕生。
文本處理再提速!完整SSE4指令支持
完整的SSE 4(Streaming SIMD Extensions 4,流式單指令多數據流擴張)指令集共包含54條指令,其中的47條指令已在45nm的Core 2上實現,稱為SSE 4.1。SSE 4.1指令的引入,進一步增強了CPU在視頻編碼/解碼、圖形處理以及遊戲等多媒體應用上的性能。其餘的7條指令在Core i7中也得以實現了,稱為SSE 4.2。SSE 4.2是對SSE 4.1的補充,主要針對的是對XML文本的字元串操作、存儲校驗CRC32的處理等。

AMD


AMD的第一款原生四核處理器是於2007年11月20日發布的基於AMD K10架構的桌面Phenom處理器(中文名為弈龍)
特性
真多核處理
支持更好的多任務處理性能,用戶可以運行更多應用和在更短時間內處理更多任務
直連架構
提供領先的PC系統性能
支持DDR2-1066的集成雙通道內存控制器
使應用性能得到極大的改進,提高了系統吞吐能力,降低了延遲,使用戶得到更佳的PC體驗
HyperTransport ? 3.0技術
4000MHz匯流排頻率提供了驚人的系統敏捷性,以實現更高的3D圖形處理性能
AMD平衡的智能緩存
支持更優的多任務處理和多線程體驗
AMD寬浮點加速器技術
改進了數字媒體和3D遊戲體驗
AMD內存優化器技術
有助於改進多線程軟體的性能
增強分支預測
為應用軟體提供更快的性能
AMD Digital Media Xpress ? 2.0
提供更銳麗、更逼真的3D圖形
具有快速虛擬化索引功能的AMD Virtualization ? 技術
幫助虛擬化軟體更安全高效地運行
Cool ‘n’ Quiet ? 2.0涼又靜技術和多點熱量監控
極為高效的性能和電源管理,支持更安靜低溫的平台設計和並為系統投資提供保護