DirectX 11

微軟公司發行的軟體

2009年10月22日,微軟公司正式發布Windows7,DirectX11集成在Windows7中同步登場,但其實DirectX11隻是DirectX10的大幅度加強版,而不是9.0C和10.0/10.1的徹底革新。

DirectX11帶來了Tessellation(拆嵌式細分曲面技術)、Multi-Threading(多線程)、DirectCompute(通用計算)、ShaderModel5.0(渲染引擎5.0)以及TextureCompression(紋理壓縮)五個重要特性,為用戶帶來更好的視覺享受。

Win7直接提供了DirectX11,而Vista則可通過升級DirectX驅動包來支持11.0。

發布


2009年9月22日ATI發布了支持DX11的基於Cypress核心的HD5800系列顯卡,而NVIDIA才剛造出支持DX11的GT300晶元的樣品。回顧DirectX歷史,從1995年Windows95里的DX1.0開始,一直保持著很快的升級速度,只有DX9系列的幾個版本維持了四年之久。用兩年的時間從DX10更新到DX11,其實也不算快。
雖然硬體已經支持DirectX11,但支持DirectX11的遊戲2010年才會大量出現。
我們知道,DX10.1將是DX10的最後一次升級,而且是非關鍵性的,接下來微軟就會直接邁入DX11。根據此前的報道,DX11的主要目標仍是降低遊戲開發難度和成本,同時更有效地發揮新硬體的能力、提高物理效果和遊戲AI、增強畫面細節複雜度、針對多核心處理器進行全面優化。
2009年1月9日星期五,微軟將面向公眾發布Windows7客戶端Beta1測試版。而此前一天,即1月8日,微軟將率先發布Windows7伺服器版本的Beta1測試版。
在微軟發布的Windows7Beta版本中,一些已經安裝使用的用戶的發現了DirectX11已經包含其中了。DirectX11作為3D圖形介面,不僅支持未來的DX11硬體,還向下兼容當前的DirectX10和10.1硬體。DirectX11增加了新的計算shader技術,可以允許GPU從事更多的通用計算工作,而不僅僅是3D運算,這可以鼓勵開發人員更好地將GPU作為并行處理器使用。

特點


DX11新增了計算著色器(ComputeShader)代碼示例,在今年的NVISION大會上,微軟就透漏了這點,並通過SIGGRAPH以及GameFest2008大會上放出的幻燈片,我們可以進行一些深入的研究。此外,DX11特性的提前放出,對於目前DX10以及DX10.1硬體用戶而言也大有裨益,因為AMD和NVIDIA可以照此提前開發適當的驅動支持。
DirectX11的諸多特性似乎暗示我們,DirectX11被迅速採用的時機已經成熟,特別是微軟的Windows7發布之後,這一趨勢將會勢不可擋。而如今,HLSL(HighLevelShadingLanguage,高級渲染語言)已經完全成熟,這勢必會讓DX11在眾遊戲開發者們眼裡變得更加具有吸引力,而且越來越多的人開始認識到DX10其實就是DX11的子集,這對於DirectX11將來被快速採用也會起到促進作用。另外,DX11可以讓平行編程變得更加容易,其獨有的特性也會促進開發者們大膽的、迅速採納這種API。DirectX11同時可以兼容Vista操作系統,所以用戶不用擔心不能升級,而Windows7與生俱來的魅力在很大程度上也會促使WindowsXP用戶們做出升級的決定,也就是說,對於開發者們而言,市場上將會有足夠大的可運行DX11的系統群體。
微軟曾許諾DirectX10可以帶來革命性的視覺體驗以及渲染技術,但結果卻是仁者見仁,不過可以肯定的是,DirectX11可能最終將會履行這一承諾。雖然我們現在不可能馬上就看到DirectX11獨有的特性所帶來的效果,但是這一新版API的普及將會對刺激適時3D繪圖技術不斷提升大有裨益。
從DirectX6到DirectX9,微軟一直在有條不紊的使他們的編程API從一種固定的功能傳播介質以及動態的數據結構向一種豐滿的、可編程的、可進行繪圖硬體深控的環境演變。從DX9到DX10的演變可以說是一種升華:DX9的可編程性得到了進一步擴展和延伸,並在新一代硬體的作用下變得更具深度和彈性。此外,微軟還通過各種手段提升了DX10的穩定性以及靈活性。但是,DirectX11的演變過程則有很多不同。
為了最大限度的提升可編程性,DX11寧可丟掉一些原有的結構效度。微軟將DirectX11構建成DirectX10/10.1的精確父集,這讓DirectX11無形中新增了很多奇妙的潛力。特別是,DX10代碼將會變成可以選擇不去執行某些先進特性的DX11代碼,而反過來,DX11又可以在所有同等水平的硬體上運行。當然了,對於DX10而言,並不是所有的DX11特性都是可用的,但是這卻意味著開發者可在採用DX11的情況下同時針對DX10和DX11硬體進行開發,而不用考慮兩者完全分開對待:因為兩者是相同的,只不過,一個是另一個的子集功能而已。但是,如果應用某些DX11獨有特效(比如說tessellator或者computeshader)時,區分代碼路徑是非常必要的,但這完全屬於從DX10向DX11過渡過程中的益處所在。

新技術預覽


1,Direct3D11渲染管線:
Direct3D11管線
Direct3D11管線
看上去,DirectX11比DirectX10更酷。DirectX11的很多提升意味著更高的特性性能,而這些特性很少能在DX10中看到。DirectX11和DirectX10兩者最大的不同之處在於管線,可以說DirectX11的渲染管線標誌著繪圖硬體以及軟體功能革命性一步。DirectX11加入了對Tessellation(鑲嵌)的支持。Tessellation由外殼著色器(HullShader)、鑲嵌單元(tessellator)以及域著色器(DomainShader)組成。同時還加入了計算著色器(ComputeShader),計算著色器與DX10中引入的GS不同,它並不是渲染管線的一部分,CS也是DirectX11的重要改進之一,可以很大程度上協助開發人員彌補現實與虛幻之間的差別。
2,Tessellation鑲嵌技術:
在此之前,關於DirectX11的報道可謂鋪天蓋地。事實上,自R600發布時,DirectX11這個字眼才開始越來越多的出現在網路上。儘管R6xx和R7xx硬體都具有tessellator單元,但是由於tessellator屬於專有實現方案(proprietaryimplementation),所以R6xx和R7xx硬體是不能直接兼容DirectX11,更何況DirectX11採用了極其精密老練的設置過程。事實上,DX11tessellator單元本身不具備可編程性,DX11向tessellator(TS)輸入或者從中輸出的過程是通過兩個傳統的管線階段完成的:HullShader(HS,外殼著色器)和DomainShader(DS,域著色器)。
tessellator可以把一些較大的圖元(primitive)分成很多更小的圖元,並將這些小圖元組合到一起,形成一種有序的幾何圖形,這種幾何圖形更複雜,當然也更接近現實。這個過程也被稱作細分曲面(SubdivisionSurfaces)。舉例來說,tessellator可以讓一個立方體,通過處理看起來像是個球形,這樣的話無疑節省了空間。此外,圖形的質量、性能以及可控性也達到了一定的促進。
HullShader負責接收一種由全四邊形網格(quadmash)計算得到的圖元數據(稱作patches),並計算控制點(controlpoints)的各種變換以及輸入的圖元各個邊的鑲嵌配置(tessellationfactors),從而進行鑲嵌。其中Controlpoints用來定義想要得到的圖形(比如說一個曲面或者其他)的圖形參數。如果您經常用Photoshop繪圖軟體的話,不妨把Controlpoints理解為PS的鋼筆工具:用平面代替線的貝塞爾曲線功能。HullShader採用controlpoints來決定如何安排tessellator處理數據,利用Tessellator生成大批量的新的圖元,然後將這些圖元以及控制點傳送給DomainShader,DomainShader將這些數據計算轉換成3D處理中的頂點,最後GPU生成曲線以及多邊形。
3,多線程的支持:
由於DX11所新增的特性甚至可以應用到DX10硬體中,所以我們對於DX11的快速應用都非常期待和樂觀。DX11特性還包括很重要一點:支持多線程(multi-threading)。沒錯,無論是DX10還是DX11,所有的色彩信息最終都將被光柵化並顯示在電腦顯示屏上(無論是通過線性的方式還是同步的),但是DX11新增了對多線程技術的支持,得益於此,應用程序可以同步創造有用資源或者管理狀態,並從所有專用線程中發送提取命令,這樣做無疑效率更高。DX11的這種多線程技術可能並不能加速繪圖的子系統(特別是當我們的GPU資源受限時),但是這樣卻可以提升線程啟動遊戲的效率,並且可以利用台式CPU核心數量不斷提高所帶來的潛力。
對於場景中的人像和三個鏡像,DX11會啟動四個單獨線程進行并行處理,效率自然要比現在依次進行的做法高很多。
搭載8顆以及16顆邏輯核心的CPU系統已經離我們越來越近,現在遊戲開發商們也該趕緊行動起來了,是時候解決有些遊戲在雙核心繫統中運行緩慢的問題了。但是開發一款能夠很大程度上促進雙核以上系統普及的遊戲,所能夠獲得的利潤以及需要的付出目前來講還很不樂觀,所以這一進程進展緩慢。對於大多數遊戲而言,充分利用四核心以及超過四核心的多線程優勢還非常困難。儘管如此,通過多線程技術讓簡單的平行運算資源產生並顯示出來,確實為採用平行運算代碼的遊戲提供了走紅的機會,這些遊戲代碼也可以以單線程編碼的方式存在。由於DX11系統中並不是採用一條線程處理所有DXstatechange以及drawcall(或者說大量同步線程共同負責某一任務)的方式,所以遊戲開發者可以很自然的創造出線程處理某個場景的某一類或者某一群的客體對象,並為將來所有客體對象或者實體為各自的線程處理打下基礎(如果邏輯核心最終達到數百顆之後,這種線程處理方式對於提取硬體性能尤為重要)。
此外,DX10硬體也能夠在運行DX11遊戲時支持多線程,微軟的這一計劃相當令人興奮,不過值得一提的是,AMD以及NVIDIA必須為各自的DX10硬體開發出相應的驅動軟體才能達到這一效果(因為如果沒有相應的驅動支持的話,DX10硬體即便可以運行DX11遊戲,對於玩家而言並不會看到真正應有的效果)。當然了,我們希望NVIDIA,特別是AMD(因為他同時也是一家可以生產多核心CPU的廠商)能夠對此感興趣。而且,如果A/N這麼做到話,無疑會為遊戲開發商們開發DX11遊戲提供誘因,即便是A/N的DX11硬體還在襁褓之中。
4,計算著色器ComputeShader:
很多遊戲開發者都對DX11新增的ComputeShader(通常簡稱為CS)特性嘖嘖稱讚。CS的這一渲染管線能夠進行更多的通用目的運算。我們既能在某種可以用來被執行數據的操作中看到這種特性,又能在某種可以用來操作的數據中看到這種特性。
在DirectX11以及CS的幫助下,遊戲開發者便可以使用更為複雜的數據結構,並在這些數據結構中運行更多的通用演演算法。與其他完整的可編程的DX10和DX11管線階段一樣,CS將會共享一套物質資源(也就是著色處理器)。
相應的硬體需要在運行CS代碼時更靈活些,這些CS代碼必須支持隨機讀寫、不規則列陣(而不是簡單的流體或者固定大小的2D列陣)、多重輸出、可根據程序員的需要直接調用個別或多線程的應用、32k大小的共享寄存空間和線程組管理系統、原子數據指令集、同步建構以及可執行無序IO運算的能力。
與此同時,CS也將會隨之失去一些特性。因為單個線程已經不再被看成是一個像素,所以線程將會喪失幾何集合功能。這就意味著,儘管CS程序依然可以利用紋理取樣功能,但是自動三線LOD過濾計算將會喪失自動功能(LOD必須被指定)。此外,一些並不重要的普通數據的深度剔除(depthculling)、反鋸齒(anti-aliasing)、alpha混合(alphablending)以及其他運算不能在一個CS程序中被執行。
除了某些特殊應用的渲染,遊戲開發者可能同時也希望做一些諸如IK(inversekinematics,反向運動學)、物理、人工智慧以及其他在GPU上執行的傳統的CPU任務之類的運算。用CS演演算法在GPU上執行這些數據意味著這些數據將會更快的被渲染,而且一些演演算法可能在GPU上的執行速度更快。如果某些總是產生同樣結果的演演算法既可以出現在CPU上又可以出現在GPU上的話,諸如AI以及物理等運算甚至可以同時在CPU和GPU上運行(這種運算實際上也可以代替帶寬)。
即便是這些運算代碼在相同的硬體(CPU或者GPU)上運行,PS以及CS代碼的執行也是兩個截然不同的過程,這主要取決於被執行的演演算法。有趣的是,暴露數據以及柱狀數據經常被用作HDR渲染。用PS代碼計算這些數據的話就需要幾條通道和幾種技巧,以便提取所有像素,從而集中或者平分這些數據。儘管共享數據將會或多或少的減緩處理速度,但是共享數據的方式要比在多通道中計算速度更快,而且這樣可以使CS成為這些演演算法的理想處理階段。
5,ShaderModel5.0:
DirectX10的ShaderModel4.0(ShaderModel以下簡稱“SM”)帶來了整數運算和位運算的功能,DirectX10.1的SM4.1加入了對MSAA的直接採樣和控制。而DirectX11包含的SM5.0,採用面向對象的概念,並且完全可以支持雙精度數據。隨著SM5.0的發布,微軟也會將HLSL語言更新至最新版本,其中包含了諸如動態著色、動態分支和更多的對象等。總之,面向專業開發人員的SM5.0,依舊是以降低編程的難度和複雜為目的。
為了解決Shader靈活性與彈性不足的問題,微軟在HLSL5.0中帶來解決之道。HLSL5.0提出shader子程序的概念,即允許程序員將各種小段、簡單或為個別需要而特製的shader程序鏈接起來,再根據實際需要動態調用,這樣既能夠提高硬體兼容性,同時減少“巨型shader”對寄存器空間的佔用,有效提升性能。
6,改進的紋理壓縮:
BC6紋理壓縮
BC6紋理壓縮
精細的紋理對視覺效果的增益是顯而易見的。目前的3D遊戲越來越傾向於使用更大、更為精細的紋理,但是過大的紋理嚴重佔用顯存和帶寬。由於目前紋理壓縮仍然不支持HDR圖像,因此DirectX11提出了更為出色的紋理壓縮演演算法——BC6和BC7。BC6是為HDR圖像設計的壓縮演演算法,壓縮比為6∶1;而BC7是為低動態範圍紋理設計的壓縮模式,壓縮比為3∶1。兩種壓縮演演算法在高壓縮比下畫質損失更少,效果更出色。
這是一幅對HDR文件的壓縮示意圖,BC6的壓縮相對於原圖來說,僅僅損失了極小的畫質,卻獲得了非常出色的效果。
紋理質量對畫面效果起著至關重要的作用。比如我們運行3D遊戲時,畫面內同樣一個物體,觀察距離較遠時,紋理銳利而清晰,但當你拉近視角,近距離細看時,紋理就非常粗糙了。更不用說在某些遊戲中還有類似放大鏡、望遠鏡等道具,啟用這些道具后,只能看到更為粗糙和不真實的紋理。出現這種問題,一方面是紋理壓縮率損失嚴重,細膩的紋理壓縮存放后,損失大量細節;另一方面是大紋理難以保證保證遊戲運行速度和軟體體積,如果在遊戲中大面積採用解析度高達4000dpi的紋理貼圖,那麼顯卡的運算資源和顯存容量很快就會告罄。因此,DirectX11最快速和最直觀的改變就是再次改進了紋理的壓縮演演算法,將紋理體積和紋理質量控制在一個相當優秀的範圍之內。

支持的遊戲


遊戲名稱發行日期製作商遊戲類型遊戲引擎備註
鍛神記
北美:2009年3月23日
歐洲:2009年3月27日
(更新入加支持):2009年9月23日
EAPhenomic大型多人在線即時戰略遊戲UnknownAMD遊戲進化計劃成員
潛行者:普里皮亞季的召喚
烏克蘭:2009年10月2日
俄羅斯:2009年10月2日
德國:2009年11月
英美:2010年2月23日
GSCGameWorld第一人稱射擊X-RayEngine(v1.6)AMD遊戲進化計劃成員
科林麥克雷拉力賽:塵埃2
北美:2009年12月1日
歐洲:2009年12月3日
英國:2009年月12月4日
Codemasters競速EGOEnginev1.0AMD遊戲進化計劃成員
異形大戰鐵血戰士
北美:2010年2月16日
歐洲:2010年2月19日
RebellionDevelopments第一人稱射擊AsuraEngineAMD遊戲進化計劃成員 
戰地:叛逆連隊2
北美:2010年3月2日
歐洲:2010年3月5日
EADigitalIllusionsCE第一人稱射擊FrostbiteEngine(v1.5)AMD遊戲進化計劃成員 
地鐵2033
北美:2010年3月16日
歐洲:2010年3月19日
澳洲:2010年3月18日
4AGames第一人稱射擊4AEnginenVIDIA遊戲之道計劃成員
指環王Online
歐美:2007年4月24日
(Volume3:Book2更新入加支持):2010年9月8日
Turbine大型多人在線角色扮演TurbineG3EngineAMD遊戲進化計劃成員
文明V
北美:2010年9月21日
歐洲:2010年9月24日
FiraxisGames回合制策略、4X概念體系UnknownAMD遊戲進化計劃成員
F12010
北美:2010年9月22日
歐洲:2010年9月23日
英國:2010年9月24日
(v1.01更新入加支持):2010年11月2日
Codemasters競速EGOEngine(v1.5)AMD遊戲進化計劃成員
榮譽勳章(2010年遊戲)
北美:2010年10月12日
歐洲:2010年10月14日
英國:2010年10月15日
多人遊戲部分製作:EADigitalIllusionsCE
單人遊戲部分製作:EALA
第一人稱射擊
(單人遊戲部分製作)UnrealEngine3
(多人遊戲部分製作)FrostbiteEngine(v1.5)
(多人遊戲部分支持DirectX11)
失落的星球2
北美:2010年10月12日
歐洲:2010年10月15日
Capcom第三人稱射擊MTFramework2.0EnginenVIDIA遊戲之道計劃成員
龍與地下城Online
歐美:2006年2月20日
(Update7更新入加支持):2010年10月20日
Turbine大型多人在線角色扮演TurbineG3AMD遊戲進化計劃成員
鷹擊長空2歐美:2010年11月12日UbisoftRomania空戰UnknownnVIDIA遊戲之道計劃成員
魔獸世界:大地的裂變
歐美:2010年12月7日港澳台:2010年12月9日
大陸:2011年7月12日
(v4.1更新入加支持):2011年4月25日
BlizzardEntertainment大型多人在線角色扮演Unknown
國土防線
北美:2011年3月15日
歐洲:2011年3月18日
遊戲主要製作:KaosStudios
PC版本技術
製作:DigitalExtremes
第一人稱射擊UnrealEngine3(v3.9)nVIDIA遊戲之道計劃成員
龍騰世紀2
北美:2011年3月8日
歐洲:2011年3月11日
BioWare角色扮演LyciumEngineAMD遊戲進化計劃成員
全面戰爭:幕府將軍2
全球:2011年3月15日
(更新入加支持):5月10日
TheCreativeAssembly回合制策略、即時戰略WarscapeengineAMD遊戲進化計劃成員
孤島危機2
北美:2011年3月22日
歐洲:2011年3月25日
(v1.9更新入加支持):2011年6月27日
單人遊戲部分製作:CrytekFrankfurt
多人遊戲部分製作:CrytekUK
第一人稱射擊CryEngine3+nVIDIA遊戲之道計劃成員
孤島危機
3
全球:2013年2月19日
單人遊戲部分製作:CrytekFrankfurt
多人遊戲部分製作:CrytekUK
第一人稱射擊CryEngine3.4nVIDIA遊戲之道計劃成員,僅支持WindowsVistasp2及以上
塵埃3歐美:2011年5月24日Codemasters競速EGOEngine(v2.0)AMD遊戲進化計劃成員
漢密爾頓的大冒險全球:2011年6月1日Fatshark
冒險
博弈
Unknown僅支持WindowsVista和Windows7
紅色派系:末日審判
北美:2011年6月7日
歐洲:2011年6月10日
Volition,Inc.第三人稱射擊Geo-Mod2.5Engine
極度恐慌3北美:2011年6月21日英國:2011年6月24日
Day1Studios
MonolithProductions
第一人稱射擊HeavilymodifiedDespairEngine
殺出重圍:人類革命
北美:2011年8月23日
英國:2011年8月26日
EidosMontreal動作角色扮演遊戲CrystalDynamicsEngine改進版AMD遊戲進化計劃成員
F120112011年9月23日Codemasters競速EGOEngine
戰地32011年10月25日EADICE第一人稱射擊FrostbiteEngine(V2.0)AMD遊戲進化計劃成員、nVIDIA遊戲之道計劃成員
黑色洛城(PC)2011年11月8日Rockstar動作冒險In-houseengin,eHavokv1.2.2610支持DX11
極品飛車:亡命天涯2011年11月15日EABlackbox競速FrostbiteEngine(V2.0)
黑道聖徒32011年11月15日THQ高自由度、動作、第三人稱射擊CTGAMD遊戲進化計劃成員
紀元20702011年11月17日Ubisoft即時戰略initEngine
蝙蝠俠:阿卡姆之城2011年11月22日Rocksteady動作UnrealEngine3nVIDIA遊戲之道計劃成員
光榮使命2011年6月26日無錫巨人網路聯合南京軍區國內第一款具有自主知識產權的大型區域網遊戲虛幻3