性能暴漲90%!英偉達(dá)SER技術(shù)如何讓光追普及,改變游戲體驗(yàn)?
近半年來,PC DIY市場可謂一片慘淡,受閃存價格飆升影響,內(nèi)存和顯卡價格紛紛上漲,不少玩家像小雷一樣,暫緩或取消了電腦升級計劃。
升級電腦無望,玩家們對游戲性能的需求該如何滿足?別擔(dān)心,微軟出手了——玩家們期待已久的DirectX 12 SER已完成技術(shù)驗(yàn)證,正式納入DXR 1.2規(guī)范。
性能最高提升90%,SER究竟是什么?
SER全稱為Shader Execution Reordering(著色器執(zhí)行重排序),這項技術(shù)最初由英偉達(dá)研發(fā),后被微軟納入DirectX 12開放規(guī)范。它的核心作用是在光追模式下重新排列GPU計算線程,歸類相似工作負(fù)載,充分釋放GPU的并行計算能力。

對于玩家而言,光追功能真是讓人又愛又恨:開啟后畫質(zhì)大幅提升,但對顯卡性能要求極高,盲目開啟可能導(dǎo)致游戲卡頓。為解決光追模式下的幀率問題,英偉達(dá)在RTX 40系顯卡首次引入SER技術(shù),不過當(dāng)時開發(fā)者需通過NVAPI或虛幻5的RTX插件才能調(diào)用。
要理解SER的用途,得先了解傳統(tǒng)顯卡在光追功能上面臨的困境。光追技術(shù)出現(xiàn)前,游戲場景光線采用光柵化渲染,這是一種循序漸進(jìn)的過程,使得傳統(tǒng)顯卡發(fā)展出SIMD架構(gòu)(單指令多數(shù)據(jù)),讓流處理器可同時處理同一渲染需求。
但開啟光追后,這種架構(gòu)就遇到了麻煩。光追本質(zhì)是模擬物理光線的漫反射,衍生的“二次光線”具有隨機(jī)性,導(dǎo)致傳統(tǒng)顯卡在計算光追路徑時,需應(yīng)對大量零碎需求,效率嚴(yán)重下降。
打個比方,原本只擰螺絲的生產(chǎn)線,某天傳送帶上出現(xiàn)螺絲、螺母、釘子等多種零件,每條產(chǎn)線只能處理部分工作,再繼續(xù)自己的任務(wù),導(dǎo)致部分性能“空轉(zhuǎn)”。
SER就像產(chǎn)線分揀員,讓GPU在計算時即時檢查和調(diào)度光線任務(wù)。在光線模擬生成前,SER會將任務(wù)放入緩沖區(qū),分類后把相似光線生成任務(wù)打包成計算塊,交給對應(yīng)產(chǎn)線處理。

簡單說,就是在原料進(jìn)入產(chǎn)線前加個分揀員,整理零件并交給對應(yīng)產(chǎn)線,讓GPU回到熟悉高效的運(yùn)行狀態(tài)。英偉達(dá)在RTX 20系列推出光追后,很快意識到光追瓶頸在于調(diào)度,于是耗時數(shù)年研發(fā)出SER。
隨后微軟將SER“招安”,畢竟好技術(shù)應(yīng)共享。當(dāng)時英偉達(dá)盈利重心轉(zhuǎn)向AI芯片,消費(fèi)端需求增長放緩且精力有限,便同意了這一要求(傳聞)。
未來不僅英偉達(dá)能用SER,AMD、英特爾等廠商的顯卡也可使用,且無需開發(fā)者針對性調(diào)用,只需支持DX12即可。這讓多數(shù)中小型廠商能放心加入光追,無需擔(dān)心優(yōu)化問題。
微軟測試報告顯示,開啟路徑光追后,SER普遍帶來20%—40%幀率提升,部分優(yōu)化Demo甚至達(dá)90%。這種無副作用的免費(fèi)提升,定會讓玩家叫好。
SER雖好,但并非所有顯卡都支持
看到這里,很多讀者會問:何時能用上?
答案很微妙。若你用RTX 40系以上顯卡且玩過《賽博朋克2077》,其實(shí)已體驗(yàn)過SER。該游戲路徑光追模式下SER自動啟用,這也是英偉達(dá)中高端顯卡能穩(wěn)定60fps以上的關(guān)鍵。
不過DirectX 12的SER并非適用于所有顯卡,需硬件調(diào)度器和驅(qū)動支持。RTX 40系以上玩家無需擔(dān)心,問題主要在AMD和英特爾用戶身上。
其中,AMD需RX 9000系列以上顯卡才能完美支持SER,因RDNA 4首次引入全新RT單元架構(gòu)。其本質(zhì)與英偉達(dá)SER硬件調(diào)度器相同,都是線程排序緩沖區(qū),使RDNA 4原生支持DXR 1.2,這也是RX 9000系光追表現(xiàn)遠(yuǎn)超RX 7000系的原因。

但RX 9000系目前只有兩款中端顯卡,性能無法滿足高端玩家需求,且受閃存漲價影響,剩余兩款高端顯卡能否今年按時發(fā)布銷售還是未知數(shù)。
英特爾情況較好,因歷史包袱?。▋H3年多),從Xe2開始原生支持SER。2024年發(fā)布的B580顯卡,售價不到兩千,2K分辨率下性能穩(wěn)超RTX 4060,接近RTX 4060Ti;光追模式原本是弱勢,憑借SER更新(90%性能提升),也追上了4060水平。
可以說,SER普及后,B580成為最香的2K游戲顯卡之一,12GB顯存避免了像英偉達(dá)甜點(diǎn)卡那樣爆顯存。今年英特爾還將推出Xe3架構(gòu)的新一代B系列顯卡,性能值得期待。

總之,SER帶來的性能提升確實(shí)顯著,但老顯卡玩家可能無法享受。小雷總結(jié),目前RTX 4060Ti、B580和RX 9070 GRE都是不錯的選擇,打算長期使用的朋友可考慮升級。
硬件提升接近瓶頸,軟件才是未來
即便顯卡支持SER,系統(tǒng)和驅(qū)動也已更新,最終仍需等待游戲更新。因很少有開發(fā)者手動優(yōu)化DirectX代碼,DirectX 12 SER普及需等虛幻5等主流引擎整合。
更扎心的是,SER不像DLSS那樣替換DLL就能生效,它涉及渲染管線底層任務(wù)調(diào)度邏輯。已發(fā)售的老游戲,除非開發(fā)商投入人力重寫渲染后端并發(fā)布大型補(bǔ)丁,否則永遠(yuǎn)無法支持SER。
其實(shí)SER的意義在于讓路徑光追真正普及,不再是少數(shù)游戲的“特權(quán)”,老顯卡也能受益,這是光追普及的附帶福利。甚至“全景光追(實(shí)時生成所有光線)”也需依靠SER才能實(shí)現(xiàn)。
目前SER主要對近兩年的顯卡生效,雖有“富人越富”之感,但技術(shù)發(fā)展本就是“旗艦平權(quán)”過程:先旗艦使用,再下放到中端、入門產(chǎn)品,最后進(jìn)入移動端,帶動行業(yè)下限提升。
在閃存漲價導(dǎo)致的“硬件寒冬”里,SER這類通過底層優(yōu)化挖掘硬件潛能的技術(shù),或許是打破性能瓶頸的關(guān)鍵。摩爾定律近年逐漸失效,硬件升級帶來的性能提升越來越少,比如RTX 50系對比40系,理論性能提升大多在20%以下。
那50系與40系幀數(shù)差距為何大?原因是DLSS等軟件優(yōu)化,如DLSS 4的多幀生成,最高能讓幀數(shù)翻8倍。未來“軟件定義硬件”的情況會更多,對玩家來說是好事,畢竟軟件升級是“真免費(fèi)”,哪怕1%的提升也很香。
本文來自微信公眾號“雷科技”,36氪經(jīng)授權(quán)發(fā)布。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com




