奔騰4
Intel生產的第7代x86微處理器
奔騰4(Pentium 4,或簡稱奔4或P4)是Intel生產的第7代x86微處理器,並且是繼1995年出品的Pentium Pro之後的第一款重新設計過的處理器,這一新的架構稱做NetBurst。
首款產品代碼為:Willamette,擁有1.4GHz左右的內核時鐘,並使用Socket 423腳位架構,首款處理器於2000年11月發布。不同於Pentium II、Pentium III和各種Celeron處理器,因為是全新設計的產品,所以與Pentium Pro的關聯很小。值得注意的是,Pentium 4有著非常快速到400MHz的前端匯流排,之後更有提升到533MHz、800MHz。它其實是一個為100MHz的四條並列匯流排(100Mhz x4 並列),因此理論上它可以傳送比一般匯流排多四倍的容量,所以號稱有400MHz的速度。AMD Athlon的前端匯流排則有266MHz的速度(133MHz雙倍並列匯流排)。
Pentium 4首款產品工程代號為:Willamette,擁有1.4GHz左右的核心時鐘,它其實是一個100MHz時鐘頻率的四倍數據速率(QDR)前端匯流排,因此數據傳輸速率為4×100MHz。
相應的,Pentium 4前期的競爭對手AMD Athlon處理器採用雙倍數據輸率(DDR)前端匯流排,擁有266MHz或333MHz的數據傳輸速率(2×133MHz、2×166MHz)。
令業界觀察人士感到意外的是,Pentium 4沒有在“整數處理速度”和“浮點性能”這兩個標準重要性能之一上比之前的P6架構設計有任何提升。相反,它通過犧牲每個周期的性能以實現非常高的時鐘速度和SSE性能。與英特爾的傳統保持一致的是,Pentium 4也有低端Celeron〔通常稱為 Celeron 4〕及Celeron版本和用於SMP配置的高端至強〔至強〕版本。
Pentium 4的設計目標是適應更快的時鐘速度,因為消費者開始依據更高的時鐘購買計算機。在這方面Pentium 4是一個經典的市場驅動技術的範例。這很快就推動了超微半導體(AMD)的 時鐘頻率神話運動。英特爾使用一個深度的指令流水線來實現這個目標,同其它如Pentium III和Athlon那樣的CPU相比Pentium 4降低了每個時鐘周期能夠處理的實際工作數目,但是它能夠以更高的時鐘速度工作。AMD則採用所謂的PR值來標示與Pentium 4相對應的Athlon XP處理器。
英特爾在發表Pentium 4時向大眾宣布說,NetBurst架構能夠運行在10GHz。然而,NetBurst架構在4GHz遇到了無法解決的高功耗問題。這迫使英特爾在2005年年中放棄了Pentium 4,並轉向升溫更少的Pentium M,祭出“MoDT (Mobile on DeskTop)”的旗幟;由此,Pentium M也被重新定位為桌面和小型伺服器市場。
Willamette
Willamette內核的Pentium 4處理器
許多業界專家認為,最初的1.4和1.5GHz P4的發布只是在產品真正完善之前的一個權宜之計。根據這些專家的觀點,Willamette的發布是因為當時競爭產品AMD AthlonThunderbird性能已經超過了Pentium III,並且英特爾對於Pentium III的改進還不現實。這個新的內核使用0.18微米〔180納米〕工藝生產,最初在主板上使用Socket 423,後來的版本更改到Socket 478。
在性能測試中,Willamette的表現有點兒讓分析人士失望,因為它不僅在所有的測試環境中不能超過Athlon和最高頻率的Pentium III,而且很明顯它並不優於低端的AMD Duron。儘管售價為819美元(1000顆的批發價),它的銷售表現一般但是增長勢頭可觀,這在一定程度上是由於需要相對較昂貴的Rambus動態隨機存儲器(RDRAM)所致。Pentium III仍然保持英特爾最賣座的晶元,Athlon的銷售也稍稍領先於Pentium 4。
在2001年1月,一個頻率更低的1.3GHz型晶元也加入到這個系列,但在隨後的12個月中,英特爾慢慢追上了AMD的領先地位。2001年4月英特爾推出了1.7GHz的P4,它是第一個性能明顯優於Pentium III的晶元。2001年7月英特爾推出了1.6和1.8GHz的型號,在8月它推出了1.9和2.0GHz的Pentium 4。在這個月中,它發布了一款新的能夠支持廉價PC133 SDRAM的晶元組。儘管使用SDRAM將比RDRAM慢很多,PC133比較低廉的價格這樣一個事實帶來了Pentium 4銷售的大幅增長,幾乎是一夜之間就將Pentium III從市場銷售首位的位置趕了下去。
2.0 GHz 是第一款真正能夠挑戰Athlon Thunderbird的P4,當時它是市場上無可爭議的最快的x86處理器。許多觀察人士認為雷鳥仍然是市場上總體性能最快的,但是它們之間的性能差距已經非常接近,所以任何一方的支持者宣稱超出對方都不是不合理的。對於英特爾來說,這是一個了不起的成就。英特爾已經在x86CPU性能上保持了16年的領先位置,在AMD Athlon發布之前只出現過兩次短暫的例外。
Northwood
2001年10月Athlon XP又一次為AMD贏得了明顯的領先,但是在2002年1月英特爾發布了使用Northwood內核的2.0和2.2GHz的Pentium 4。Northwood將二級緩存的大小從256KB增加到了512KB(晶體管數量從4200萬增加到5500萬)並且使用了130納米製造工藝。使用更小晶體管製造的晶元能夠在同樣的速度產生更少的熱量,或者工作在更高的時鐘頻率。不幸的是,對於許多用戶來說,這個新的晶元不能用來升級舊的系統,因為它需要一個新的插座(Socket 478),雖然後來又製造了能夠讓Socket 423使用Northwood處理器的轉換器。
Northwood帶來了Pentium 4時代。儘管爭奪性能領先的戰鬥依然很激烈(因為AMD發布了更快版本的Athlon XP),但是許多觀察人士都認同最快的Northwood P4稍稍領先於對手。尤其是在2002年夏天更是這樣,當時AMD轉換到130納米製造技術過程被延遲,從2.4到2.8GHz範圍的P4很顯然是當時市場上最快的晶元。
2.4GHz的Pentium 4於2002年4月發布,匯流排速度從400MHz(100MHz四倍)提升到533MHz(133MHz四倍)用於5月發布的2.53GHz、8月發布的2.6和2.8GHz P4,3.06GHz的Pentium 4在11月發布。
3.06GHz的處理器支持超線程(首次出現在至強處理器中),它允許多個線程同時運行,它通過複製處理器的一部分讓操作系統認為有兩個邏輯處理器來實現。在所有的Northwood CPU中都有超線程機制,但是只在3.06GHz型號中允許使用。
2003年4月,英特爾發布了一系列頻率範圍從2.4到3.0GHz的新款800MHz FSB晶元。這些新版本的與以往晶元的主要不同就是全部都支持超線程機制,並且系統匯流排頻率是800MHz。人們曾經猜想這些是為了與AMD處理器的Hammer系列競爭。然而,AMD只發布了Opteron一款,並且最初拒絕提供AGP控制器,這樣就阻止了Opteron侵蝕Pentium 4的領地。AMD的確也將Athlon XP的匯流排速度從333MHz提升到了400MHz,但這並不能阻止新款的3.0GHz P4,並且FSB不是問題所在;從333MHz到400MHz的轉換僅僅帶來了很小的乃至沒有性能提升。3.2GHz的Pentium 4在6月上市,最後一個3.4GHz的版本在2004年早期上市。
評價
過分超頻早期的Northwood晶元將會產生令人震驚的現象。當內核電壓超過1.7V時,處理器將隨時間延長逐漸變得不穩定,直至最後壞掉完全不能再用。人們認為這是由於電子遷移這種物理現象導致的,其中CPU的內部通路由於過度的電子能量隨著時間逐步退化。這也被稱為Northwood突然死亡症( Sudden Northwood Death Syndrome)。Mobile Pentium 4 Mobile Intel Pentium 4 Processor Intel Mobile Pentium 4處理器與Mobile Pentium 4-M不同,外觀上在大的差別就是Mobile Pentium 4上與桌面型Pentium 4處理器一樣有晶圓上的鐵蓋,INTEL將它定位使用筆記本電腦取代台式機的用戶,他與桌面型的Pentium 4一樣使用Socket 478的插槽,它也提供Hyper-Threading超線程與EIST的功能,FSB也比Mobile P4-M的400高,達到FSB533。新型的Mobile P4采90納米工藝,最高時鐘高達3.4GHz以及1MB的L2高速緩存。
Pentium
也是基於Northwood內核, Mobile Intel Pentium 4 Processor - M在2002年4月23日發布,它包括了英特爾的EIST技術來降低功耗,但是不包括超線程技術,L2最大512K,最高時鐘為3.06GHz。同時期的廉價版Celeron也有推出類似Mobile Pentium 4-M的處理器,FSB與P4-M相同但L2降為P4-M的一半只有256K,後期的產品最高時鐘可達2.8GHz。
Extreme
2003年9月,在英特爾開發者論壇上,Pentium 4極致版(Pentium 4 Extreme Edition,P4EE)面世了,這僅僅比AMD的Athlon 64和Athlon 64 FX(AMD64 FX)的發布早了一個星期。這個設計絕大部分與Pentium 4相同(以至於它們能工作在同一個主板),但是它增加了一個2MB的3級緩存。它與至強MP使用同一個Gallatin內核,儘管它使用Socket 478形式(不同於至強MP的603插座)和是至強 MP速度兩倍的800MHz匯流排。它同時也提供LGA775版本。
儘管英特爾宣稱極致版主要面向遊戲人員,人們認為這是英特爾試圖減弱Athlon 64發布的震撼一種努力,將它戲稱為“緊急版本”。令人奇怪的是,儘管很多人批評英特爾從至強系列拼湊技術,但是很少有人批評AMD,AMD在它們的Athlon 64 FX上使用了同樣的方法(它與Opteron的差別甚至少於極致版與至強 MP的區別)。
增加的緩存的功效在不同環境會有所不同。在辦公室應用中,極致版總體上比Northwood慢一點兒,這是由於L3緩存增加了門檻值。一些遊戲程序受益於增加的緩存,尤其是那些基於Quake III和Unreal引擎的遊戲。然而,提升最大的是在多媒體編碼領域,在這裡它不僅比奔騰4要快,而且比兩款Athlon 64快。
在2004年晚些時候通過將匯流排速度從800MHz提升到1066MHz實現了小幅的性能提升。在Extreme Edition遷移到Prescott內核之前僅僅發布了一款3.46GHz基於Gallatin內核的晶元。新的3.73GHz Extreme Edition與6x0系列的Prescott 2M有同樣的特性,不同的是它使用1066MHz匯流排。然而實際上3.73GHz Extreme Edition幾乎總是比3.46GHz版本的速度要慢。
不要把 Pentium 4極致版與後來發布的有類似名字的基於雙核Pentium D的 Pentium極致版相混淆。
Prescott
2004年2月1日英特爾提出了一個代號為“Prescott”的新內核。這個內核首次使用90納米的製造工藝,並且“它”是奔騰4微架構的一次重要更新——重要到足夠讓一些分析人士感到奇怪為什麼英特爾沒有選擇將這個處理器稱為Pentium 5。儘管Prescott工作在與Northwood相同的時鐘速度,性能測試也顯示在遊戲應用程序中Northwood比Prescott還要稍微快一點兒,但是在視頻編輯以及其它的多媒體應用中,Prescott額外的緩存讓它比Northwood有明顯的速度優勢。Prescott的架構允許它很容易地使用更高的時鐘速度。(參見超頻。)3.8GHz是批量生產的基於Prescott處理器的最快的處理器。
緊接著產品發布之後,人們就發現Prescott每個時鐘周期比Northwood多產生大約60%的熱量,幾乎所有的評論都是負面的。插座類型的轉換(從Socket 478到LGA775)原本希望能夠將發熱降低到可以接受的水平,但是實際上卻是產生了相反的效果,同時功率消耗也增加的大約10%。但是,LGA775涉及的降溫和安裝系統是一種更好的設計,所以平均溫度有輕微的降低。英特爾工程師隨後對處理器進行的修改工作有望降低平均溫度,但是這除了降低速度等級之外從來也沒有先例。
最後,溫度問題變得非常嚴重英特爾不得不全部放棄Prescott架構,並且開發4GHz部分的努力也被認為是浪費內部資源而被放棄了。另外的擔憂是審查發現極端狀況下需要5.2GHz的Prescott內核才能與2.6GHz的Athlon FX-55的性能相比。回首當初英特爾發布Pentium 4時吹噓的Pentium 4是為10GHz的處理速度設計的,這將被看作英特爾歷史上最重要的或許也是最廣為人知的工程失敗(engineering shortfalls)事件。
據報道Pentium M英特爾設計成員內部的參考設計,Pentium 4的開發實質上已經被放棄。
Prescott以這樣一個災難性的結局終結是英特爾內部的策略使然。市場部不斷地要求更高的時鐘速度以使他們的產品與AMD有所區別。處理器的設計被市場需求而不是被架構本身所控制。職業發展也基於更高時鐘速度這樣一個理念,當P4項目終止最終到來的時候,它對於有著資助良好的桌面分部的許多管理人員有著嚴重的影響。
最初有兩種Prescott產品線上市:帶有800MHz FSB和支持超線程的E系列以及533MHz FSB和不支持超線程的A系列。
LGA775 Prescott使用一個評價系統將它們標記為5xx系列(Celeron D是3xx系列,Pentium M是7xx系列)。E系列的LGA775版本使用型號5x0(520-560),A系列的LGA775版本使用型號5x5和5x9(505-519)。最快的570J和571工作在3.8GHz。
5x0J系列(以及相應的低端版本5x5J系列和5x9J系列)為英特爾處理器產品線引進了XD bit(eXecute Disable)或執行禁止位。這項最初由AMD最初使用並稱為NX bit的技術能夠幫助阻止一定類型的有害代碼非法利用緩存器溢出來執行。
英特爾也發布了一系列支持EM64T的Prescott產品,它們是AMD64對於x86體系的64位擴充的 英特爾實現方法。這些產品最初作為F系列並且僅對OEM銷售,但是後來重命名為5x1系列並且面向大眾銷售。兩款低端的基於5x5/5x9系列的支持EM64T的Prescott也使用506和516的型號已經發布。
5x0、5x0J和5x1 Prescott為了加速一些諸如視頻編輯這樣使用多線程軟體的處理器都集成有超線程技術。
Prescott 2M
英特爾在2005年第一季度發布了代號為“Prescott 2M”的編號6x0的新版Prescott內核。它包含了嶄新的64位技術(AMD64的實現,英特爾稱為EM64T)、XD、EIST(英特爾增強SpeedStep技術)以及2MB的L2緩存。然而,增加緩存帶來的優勢大部分被更高的緩存門檻、EM64T模式下的雙字大小所抵消。雙倍的緩存與其說是為了加快速度,不如說是為了提供同樣的空間以保證64位模式下的性能。
6xx系列的Prescott 2M處理器為了加速用於如視頻編輯等多線程軟體的處理器,它們都包含有超線程技術。
2005年11月14日,英特爾發布了帶有VT(虛擬技術,代號為“Vanderpool”)的Prescott 2M處理器。英特爾只發布了兩款這種分別運行於3.6GHz 和 3.8GHz的Prescott 2M處理器:662和672。
Cedar Mill
英特爾將在2006年第一季度發布代號為'Cedar Mill'的最後一個奔騰4版本。有86W TDP的Cedar Mill有望解決Prescott的過熱問題。Cedar Mill有一個65nm工藝的內核,帶有31級的流水線(同Prescott一樣)、800MHz的FSB、EM64T、超線程和虛擬技術。Cedar Mill將帶有一個2MB的L2緩存。Cedar Mill將作為從頻率2.8GHz到3.8GHz的奔騰6x1和6x3發布,如果市場足夠大的話,英特爾將會發布4.0GHz或者更高時鐘頻率的晶元。
雙核
Pentium D初推出時的商標
綽號為Smithfield內核的第一款Pentium D處理器使兩個相連的Prescott內核。電源消耗大約155瓦。英特爾開發人員通過讓每個內核工作在極低的時鐘頻率實現了降低了從Prescott的電力消耗(115瓦)的大幅度增加。極致版工作在3.2GHz,主流型號的頻率分別為3.2、3.0和2.8GHz。除805使用533MHz FSB外,其他基於Smithfield的處理器都使用800MHz的FSB。
2006年第一季度推出的是Presler,它是一個Smithfield內核的65納米版本。基於Presler的Pentium D有800MHz的FSB、發布型號將是920、930、940、950,分別工作在2.8、3.0、3.2和3.4GHz。基於Presler的奔騰極致版使用型號955,工作在3.46GHz,帶有1066MHz的FSB和超線程技術。
不同版本英特爾Pentium 4處理的列表以及它們不同的特點。
公開名稱 | 內核 | CPU頻率 | Socket | FSB/理論 寬度 | 高速緩存 | 其它特點 |
最初發布版本 | Willamette | 1.3 GHz - 2.0 GHz | 423, 478 | 400 MHz / 3.2 GB/s | 8 KB L1 數據 + 12 KB L1 指令 / 256 KB L2 | 20 級流水線,MMX / SSE / SSE2 指令 |
P4A | Northwood | 1.6 GHz - 2.8 GHz | 478 | 400 MHz / 3.2 GB/s | 8 KB L1 數據 + 12 KB L1 指令 / 512 KB L2 | 改進的分支預測和其它的偽代碼調整; |
P4B | Northwood | 2.0 GHz - 3.06 GHz | 478 | 533 MHz / 4.2 GB/s | 8 KB L1 數據 + 12 KB L1 指令 / 512 KB L2 | 更高前置匯流排, |
P4C | Northwood | 2.4 GHz - 3.4 GHz | 478 | 800 MHz / 6.4 GB/s | 8 KB L1 數據 + 12 KB L1 指令 / 512 KB L2 | 更高前置匯流排,超線程,21級的流水線,MMX / SSE / SSE2指令 |
P4E/5x0 系列 | Prescott | 2.8 GHz - 3.6 GHz | 478,LGA775 | 800 MHz / 6.4 GB/s | 16 KB L1 數據 + 12 KB L1 指令 / 1024 KB L2 | 超線程,31級的流水線,MMX / SSE / SSE2 / SSE3 指令 |
P4A* /5x5/5x9 系列 | Prescott | 2.4 GHz - 3.06 GHz | 478, LGA775 | 533 MHz / 4.2 GB/s | 16 KB L1 數據 + 12 KB L1 指令 / 1024 KB L2 | 不支持超線程,31級的流水線,MMX / SSE / SSE2 / SSE3 指令 |
P4 Extreme Edition | Gallatin | 3.2 GHz - 3.4 GHz | 478, LGA775 | 800 MHz / 6.4 GB/s | 8 KB L1 數據 + 12 KB L1 指令 / 512 KB L2 / 2 MB L3 | 超線程,增加L3內存,21級的流水線,MMX / SSE / SSE2指令 |
5x0J 系列 | Prescott | 2.8 GHz - 3.8 GHz | LGA775 | 800 MT/s / 6.4 GB/s | 16 KB L1 數據 + 12 KiB L1 指令 / 1 MB L2 | 超線程、執行禁止位(eXecute Disable bit) |
5x5J/5x9J 系列 | Prescott | 2.67 GHz - 3.06 GHz | LGA775 | 533 MT/s / 4.2 GB/s | 16 KB L1 數據 + 12 KiB L1 指令 / 1 MB L2 | 無超線程、執行禁止位、 |
P4F/5x1 系列 | Prescott | 2.8 GHz - 3.8 GHz | LGA775 | 800 MT/s / 6.4 GB/s | 16 KB L1 數據 + 12 KiB L1 指令 / 1 MB L2 | 支持EM64T、31 級指令流水線、MMX / SSE / SSE2 / SSE3 指令 |
6x0 系列 | Prescott 2M** | 3.0 GHz - 3.8 GHz | LGA775 | 800 MT/s / 6.4 GB/s | 16 KB L1 數據 + 12 KiB L1 指令 / 2 MB L2 | 超線程、2 MiB L2 緩存、支持EM64T |
6x1 系列 | Prescott 2M** | 3.6 GHz - 3.8 GHz | LGA775 | 800 MT/s / 6.4 GB/s | 16 KB L1 數據 + 12 KiB L1 指令 / 2 MB L2 | 超線程、2 MiB L2 緩存、支持EM64T |
6x2 系列 | Cedar Mill | 3.0 GHz - 3.8 GHz | LGA775 | 800 MT/s / 6.4 GB/s | 16 KB L1 數據 + 12 KiB L1 指令 / 2 MB L2 | 超線程、2 MiB L2 緩存、支持EM64T |
P4 Extreme Edition | Gallatin | 3.46 GHz | LGA775 | 1066 MT/s / 8.5 GB/s | 8 KB L1 數據 + 12 KiB L1 指令 / 512 KiB L2 / 2 MB L3 | addition of on-die L3 緩存、 |
P4 Extreme Edition | Prescott 2M** | 3.73 GHz | LGA775 | 1066 MT/s / 8.5 GB/s | 16 KB L1 數據 + 12 KiB L1 指令 / 2 MB L2 緩存 | 超線程、更快前端匯流排、 |
5x6 系列 | Prescott | 2.67 GHz - 2.93 GHz | LGA775 | 533 MT/s / 4.2 GB/s | 16 KB L1 數據 + 12 KiB L1 指令 / 1 MB L2 | 無超線程、支持EM64T |
奔騰 4 處理器使用能夠在方波四個狀態(上升、峰值、下降和谷值)傳送數據的前端匯流排,而不是像以前的處理器那樣使用一個狀態,這樣控制時鐘的方波頻率是FSB頻率的四分之一。400、533、800和1066 MT每秒的匯流排使用的是100、 133、200和266MHz的方波。
* - 在作Prescott處理器系列規劃的時候英特爾重複了“P4A”的命名,他們認為零售商會用這個名稱讓用戶認識這個處理器;他們對於這種做法沒有給出任何理由
** - 600系列的正式名稱,儘管有時稱作等同於至強,使用了Irwindale以將它與最初的Prescott區分開來。