當前位置:編程學習大全網 - 編程語言 - 介紹壹下DX11

介紹壹下DX11

微軟在CES 2008上透露,下壹代API接口DirectX 11預計將在2008年底或2009年制定效果完成。當然,這並不就代表DX11就壹定會在去年底今年初正式發布,在硬件方面DX10顯卡現在還未全面普及,目前,ATI剛剛發布了支持DX11的基於Cypress核心的HD5800系列顯卡,而NVIDIA才剛造出支持DX11的GT300芯片的樣品。

DirectX 11 新技術預覽:

1,Direct3D11渲染管線:

看上去,DirectX 11比DirectX 10更酷。DirectX 11的很多提升意味著更高的特性性能,而這些特性很少能在DX10中看到。DirectX 11和DirectX 10兩者最大的不同之處在於管線,可以說DirectX 11的渲染管線標誌著繪圖硬件以及軟件功能革命性壹步。DirectX 11加入了對Tessellation(鑲嵌)的支持。Tessellation 由外殼著色器(Hull Shader)、鑲嵌單元(tessellator)以及域著色器(Domain Shader)組成。同時還加入了計算著色器(Compute Shader),計算著色器與DX10中引入的GS不同,它並不是渲染管線的壹部分,CS也是DirectX 11的重要改進之壹,可以很大程度上協助開發人員彌補現實與虛幻之間的差別。

2,Tessellation鑲嵌技術:

在此之前,關於DirectX 11的報道可謂鋪天蓋地。事實上,自R600發布時,DirectX 11這個字眼才開始越來越多的出現在網絡上。盡管R6xx和R7xx硬件都具有tessellator單元,但是由於tessellator屬於專有實現方案(proprietary implementation),所以R6xx和R7xx硬件是不能直接兼容DirectX 11,更何況DirectX 11采用了極其精密老練的設置過程。事實上,DX11 tessellator單元本身不具備可編程性,DX11向tessellator (TS)輸入或者從中輸出的過程是通過兩個傳統的管線階段完成的:Hull Shader (HS,外殼著色器)和Domain Shader (DS,域著色器)。

tessellator可以把壹些較大的圖元(primitive)分成很多更小的圖元,並將這些小圖元組合到壹起,形成壹種有序的幾何圖形,這種幾何圖形更復雜,當然也更接近現實。這個過程也被稱作細分曲面(Subdivision Surfaces)。舉例來說,tessellator可以讓壹個立方體,通過處理看起來像是個球形,這樣的話無疑節省了空間。此外,圖形的質量、性能以及可控性也達到了壹定的促進。

Hull Shader負責接收壹種由全四邊形網格(quad mash)計算得到的圖元數據(稱作patches),並計算控制點(control points)的各種變換以及輸入的圖元各個邊的鑲嵌配置(tessellation factors),從而進行鑲嵌。其中Control points用來定義想要得到的圖形(比如說壹個曲面或者其他)的圖形參數。如果您經常用Photoshop繪圖軟件的話,不妨把Control points理解為PS的鋼筆工具:用平面代替線的貝塞爾曲線功能。Hull Shader采用control points來決定如何安排tessellator處理數據,利用Tessellator生成大批量的新的圖元,然後將這些圖元以及控制點傳送給 Domain Shader,Domain Shader將這些數據計算轉換成3D處理中的頂點,最後GPU生成曲線以及多邊形。

3,多線程的支持:由於DX11所新增的特性甚至可以應用到DX10硬件中,所以我們對於DX11的快速應用都非常期待和樂觀。DX11特性還包括很重要壹點:支持多線程(multi-threading)。沒錯,無論是DX10還是DX11,所有的色彩信息最終都將被光柵化並顯示在電腦顯示屏上(無論是通過線性的方式還是同步的),但是DX11新增了對多線程技術的支持,得益於此,應用程序可以同步創造有用資源或者管理狀態,並從所有專用線程中發送提取命令,這樣做無疑效率更高。DX11的這種多線程技術可能並不能加速繪圖的子系統(特別是當我們的GPU資源受限時),但是這樣卻可以提升線程啟動遊戲的效率,並且可以利用臺式CPU核心數量不斷提高所帶來的潛力。

對於場景中的人像和三個鏡像,DX11會啟動四個單獨線程進行並行處理,效率自然要比現在依次進行的做法高很多。

搭載8顆以及16顆邏輯核心的CPU系統已經離我們越來越近,現在遊戲開發商們也該趕緊行動起來了,是時候解決有些遊戲在雙核心系統中運行緩慢的問題了。但是開發壹款能夠很大程度上促進雙核以上系統普及的遊戲,所能夠獲得的利潤以及需要的付出目前來講還很不樂觀,所以這壹進程進展緩慢。對於大多數遊戲而言,充分利用四核心以及超過四核心的多線程優勢還非常困難。盡管如此,通過多線程技術讓簡單的平行運算資源產生並顯示出來,確實為采用平行運算代碼的遊戲提供了走紅的機會,這些遊戲代碼也可以以單線程編碼的方式存在。由於DX11系統中並不是采用壹條線程處理所有DX state change以及draw call(或者說大量同步線程***同負責某壹任務)的方式,所以遊戲開發者可以很自然的創造出線程處理某個場景的某壹類或者某壹群的客體對象,並為將來所有客體對象或者實體為各自的線程處理打下基礎(如果邏輯核心最終達到數百顆之後,這種線程處理方式對於提取硬件性能尤為重要)。

此外,DX10硬件也能夠在運行DX11遊戲時支持多線程,微軟的這壹計劃相當令人興奮,不過值得壹提的是,AMD以及NVIDIA必須為各自的DX10硬件開發出相應的驅動軟件才能達到這壹效果(因為如果沒有相應的驅動支持的話,DX10硬件即便可以運行DX11遊戲,對於玩家而言並不會看到真正應有的效果)。當然了,我們希望NVIDIA,特別是AMD(因為他同時也是壹家可以生產多核心 CPU的廠商)能夠對此感興趣。而且,如果A/N這麽做到話,無疑會為遊戲開發商們開發DX11遊戲提供誘因,即便是A/N的DX11硬件還在繈褓之中。

4,計算著色器Compute Shader:

很多遊戲開發者都對DX11新增的Compute Shader(通常簡稱為CS)特性嘖嘖稱贊。CS的這壹渲染管線能夠進行更多的通用目的運算。我們既能在某種可以用來被執行數據的操作中看到這種特性,又能在某種可以用來操作的數據中看到這種特性。

在DirectX11以及CS的幫助下,遊戲開發者便可以使用更為復雜的數據結構,並在這些數據結構中運行更多的通用算法。與其他完整的可編程的DX10和DX11管線階段壹樣,CS將會***享壹套物質資源(也就是著色處理器)。

相應的硬件需要在運行CS代碼時更靈活些,這些CS代碼必須支持隨機讀寫、不規則列陣(而不是簡單的流體或者固定大小的2D列陣)、多重輸出、可根據程序員的需要直接調用個別或多線程的應用、32k大小的***享寄存空間和線程組管理系統、原子數據指令集、同步建構以及可執行無序IO運算的能力。

與此同時,CS也將會隨之失去壹些特性。因為單個線程已經不再被看成是壹個像素,所以線程將會喪失幾何集合功能。這就意味著,盡管CS程序依然可以利用紋理取樣功能,但是自動三線LOD過濾計算將會喪失自動功能(LOD必須被指定)。此外,壹些並不重要的普通數據的深度剔除(depth culling)、反鋸齒(anti-aliasing)、alpha混合(alpha blending)以及其他運算不能在壹個CS程序中被執行。

除了某些特殊應用的渲染,遊戲開發者可能同時也希望做壹些諸如IK(inverse kinematics,反向運動學)、物理、人工智能以及其他在GPU上執行的傳統的CPU任務之類的運算。用CS算法在GPU上執行這些數據意味著這些數據將會更快的被渲染,而且壹些算法可能在GPU上的執行速度更快。如果某些總是產生同樣結果的算法既可以出現在CPU上又可以出現在GPU上的話,諸如 AI以及物理等運算甚至可以同時在CPU和GPU上運行(這種運算實際上也可以代替帶寬)。

即便是這些運算代碼在相同的硬件(CPU或者GPU)上運行,PS以及CS代碼的執行也是兩個截然不同的過程,這主要取決於被執行的算法。有趣的是,暴露數據以及柱狀數據經常被用作HDR渲染。用PS代碼計算這些數據的話就需要幾條通道和幾種技巧,以便提取所有像素,從而集中或者平分這些數據。盡管***享數據將會或多或少的減緩處理速度,但是***享數據的方式要比在多通道中計算速度更快,而且這樣可以使CS成為這些算法的理想處理階段。

5,Shader Model 5.0:

DirectX 10的Shader Model 4.0(Shader Model以下簡稱“SM”)帶來了整數運算和位運算的功能,DirectX 10.1的SM 4.1加入了對MSAA的直接采樣和控制。而DirectX 11包含的SM 5.0,采用面向對象的概念,並且完全可以支持雙精度數據。隨著SM 5.0的發布,微軟也會將HLSL語言更新至最新版本,其中包含了諸如動態著色、動態分支和更多的對象等。總之,面向專業開發人員的SM 5.0,依舊是以降低編程的難度和復雜為目的。

為了解決Shader靈活性與彈性不足的問題,微軟在HLSL5.0中帶來解決之道。 HLSL5.0提出shader子程序的概念,即允許程序員將各種小段、簡單或為個別需要而特制的shader程序鏈接起來,再根據實際需要動態調用,這樣既能夠提高硬件兼容性,同時減少“巨型shader”對寄存器空間的占用,有效提升性能。

6,改進的紋理壓縮:精細的紋理對視覺效果的增益是顯而易見的。目前的3D遊戲越來越傾向於使用更大、更為精細的紋理,但是過大的紋理嚴重占用顯存和帶寬。由於目前紋理壓縮仍然不支持HDR圖像,因此DirectX 11提出了更為出色的紋理壓縮算法——BC6和BC7。BC6是為HDR圖像設計的壓縮算法,壓縮比為6∶1;而BC7是為低動態範圍紋理設計的壓縮模式,壓縮比為3∶1。兩種壓縮算法在高壓縮比下畫質損失更少,效果更出色。

  • 上一篇:折彎的拼音狐折彎的拼音是什麽
  • 下一篇:焊工年終工作總結範文(精選6篇)
  • copyright 2024編程學習大全網