0
去年6月,英特爾發布首款桌面級獨立顯卡銳炫A380時,持觀望態度的消費者居多。
一年過去,英特爾為獨立顯卡更新了21次驅動更新,每一次更新都實現了性能的提升。用行動展示了英特爾在做獨立顯卡方面的決心,也增加了消費者的興趣。

“我們在顯卡GPU的路徑上一定會堅持‘一條道走到亮’。”英特爾公司中國區技術部總經理高宇在近期的一場技術分享會上再次強調。
但真正能夠直接打動用戶的,是過去一段時間有42款新發售的游戲首日英特爾就提供了驅動優化支持。另外,針對視頻創作者常用的DaVinci和剪映,英特爾也進行了充分適配。

追求更高性價比的游戲玩家,以及追求更高效率的內容創作者,顯然會更期待銳炫帶來的不一樣的選擇。
銳炫GPU硬件的六大特性
強大的GPU一定是優秀的硬件和軟件的融合。對于英特爾來說,設計出一款硬件架構優秀的獨立GPU難度不高。
去年發布基于英特爾 Xe HPG 微架構的桌面級獨立顯卡銳炫 A 系列時,六大硬件先進性就讓人印象深刻,包含:
一是銳炫近乎完美地支持DirectX 12 Ultimate的所有功能;
二是首代產品就實現了光線追蹤,銳炫顯卡中光線追蹤的物理加速單元,每一個Xe Core里都有Ray Tracking 單元(RTU)和Thread Sorting 單元(TSU),都是為光線追蹤效率提升而設計專門的硬件加速器;
三是架構中包含XMX AI矩陣加速器,AI的性能可以有數量級的提升;
四是借助高性能的AI加速器,設計了XeSS AI超級采樣技術,讓所有游戲從畫質到性能都能實現飛躍式提升;
五是繼承了英特爾媒體功能的“強大血統”,銳炫GPU中包含兩個專用媒體編解碼器,幾乎可以支持互聯網上的所有媒體格式;
六是英特爾GPU率先支持AV1編解碼的硬解和硬編。得益于AV1免費、高壓縮、高畫質的特點,視頻網站未來將快速的從傳統編解碼格式遷移到AV1,英特爾做到了第一個支持。
游戲玩家期待更高性價比的獨立顯卡
GPU用戶要感知到硬件的先進性,還需要借助軟件。
也就是說,GPU的打磨,發布之前的重心在于硬件,發布之后的焦點在于軟件。
“軟件層面的優化既包括顯卡綜合軟件性能的提升也需要生態方面的不斷拓展。”高宇指出。
從提升游戲體驗的角度,可以優化的有兩個方面,驅動和與開發者合作。
驅動的更新能夠帶來游戲性能的提升,也決定著游戲支持的效果。
“我們聽到很多的客戶反饋,說英特爾的顯卡很先進,但對老游戲支持稍顯欠缺。于是我們致力于解決這個問題,銳炫在二月的驅動更新中,DX9游戲的性能提升高達43%。”從高宇舉的例子就足以說明英特爾對于玩家的重視。
實際上,英特爾GPU軟件團隊在產品發布后根據獲得的反饋,對DX9的驅動進行重構,實現了性能提升。
和開發者的合作和支持游戲生態的挑戰更加巨大。以取得不錯成績的英特爾XeSS技術為例,目前已經有超過50款游戲集成了XeSS選項,其中許多是國際大作。

XeSS是一個基于深度學習的時間攤銷的超級采樣技術,主要的目的有兩個,一個是進行高質量圖像放大,比如將1080P的圖像放大到4K,另一個是做到非常高的的抗鋸齒。

超級采樣技術在GPU領域不是一個新技術,技術層面有挑戰,但更難的是與開發者合作充分發揮出XeSS的優勢。
“一些游戲默認只要檢測到是英特爾的顯卡,就會識別成一個集成顯卡,光線追蹤等效果默認關閉。”英特爾GPU軟件團隊的工程師說,“首先要讓開發者拿到我們的卡,才能進一步適配和優化,要展現出英特爾XeSS在性能和畫質上的優勢,然后說服他們集成英特爾的技術。”
游戲開發者想要發揮出XeSS的優勢,需要動態矢量圖和低分辨率的RGB的圖像兩個數據,利用這兩塊數據就能讓XeSS模型輸出高質量、高分辨率的圖像。
XeSS作為基于AI的技術,一個顯著的優勢就是可以調整參數進行優化。
“我們用非常多數據集訓練XeSS模型,但難免有一些非常罕見的場景缺乏數據。現在我們通過和一些游戲開發者合作,把他們的數據加到我們的訓練集里面,新訓練出來的模型就可以很好的解決比如罕見閃爍的情況。”英特爾的工程師說。
最新發布的XeSS 1.1版本,相比XeSS 1.0進一步提高了圖像質量和時間穩定性,并添加了自動曝光功能支持以提高視覺質量。通過針對性的優化,XeSS 1.1改善了游戲中出現閃爍和摩爾紋等情況,英特爾獨立顯卡和集成顯卡用戶都能享受到更好的游戲體驗。

在XeSS的游戲集成上,英特爾也提供了全面的支持。對于基于Unreal Engine的游戲,通過插件這種簡單的方式支持XeSS,包括Unreal Engine* 4.26+和Unreal Engine* 5,剛剛發布的Unreal Engine* 5.2版本,XeSS也率先提供了支持。
至于自研游戲引擎,英特爾提供了豐富的文檔、示例代碼和工程師來幫助開發者集成XeSS技術。
英特爾如此多舉措就是希望方便開發者集成XeSS技術,當然也就是讓最終的游戲玩家能夠有更好的游戲體驗。
借助XeSS技術,配合內核性能的優化,在銳炫A770和A750顯卡上,把游戲畫質開到最高,把光追效果開啟,也可以達到非常流暢的效果,暢玩3A大作。

用主流的銳炫A380,可以在1080P的分辨率上,配合XeSS技術,絕大部分游戲可以跑在60幀或以上,有非常流暢的游戲體驗。

顯然,對于大部分購買1千元級顯卡的玩家,能有以足夠高的性價比獲得足夠的游戲體驗,這對于大量游戲玩家來說,都是一個不錯的新選擇。
視頻創作者期待導出時間加速
GPU游戲的體驗在于適配的游戲以及畫質的流暢和穩定,那用GPU作為生產力工具關鍵的就是效率。
在視頻創作者圈子,DaVinci(達芬奇)和剪映都是非常流行的專業視頻剪輯軟件。針對這兩個視頻剪輯軟件的性能優化,就足以讓許多視頻創作者充滿期待。
銳炫 GPU全系產品都配備了完整的高級Xe的媒體引擎,這個媒體引擎中包含了兩套視頻編解碼器和視頻后處理器,通過驅動的優化,可以減少硬件額外的開銷并發揮硬件的潛能。
達芬奇的工作負載比較復雜的,有編碼、解碼,也會用局部的通用計算處理一些比較復雜的特效。
英特爾銳炫軟件團隊針對芬奇的負載優化了OpenCL的驅動,以去年發布的3959驅動和最新發布的4369驅動對比,運用PugetBench的達芬奇,在銳炫A750上面,總體性能提升達到33%,其中一些fusion任務子項的提升有40%,4K media任務提升27%。在銳炫A770上提升的幅度更大,總體提升能夠達到40%。

這些性能的提升主要得益于針對OpenCL驅動做了三個主要的優化:集中式緩存池,針對主存和顯存拷貝的優化,資源延遲銷毀。
除了減少驅動開銷,通過精細化的同步來提高GPU引擎的利用率。銳炫 GPU也通過適配內容創作軟件,可以充分發揮GPU的獨特功能加速任務。
典型的一個場景,DaVinci 能夠充分利用英特爾銳炫顯卡的視頻后處理器引擎,從而帶來 近2 倍性能提升,實現了雙路 8K60FPS 視頻素材的實時預覽。

針對剪映優化的一個難點是有時候會出現解碼引擎、編碼引擎、3D引擎等三五個引擎一起工作的情況,這些引擎一起工作就像流水線一樣,要進行優化就需要處理好引擎之間的依賴關系。

“針對剪映的純視頻導出的場景,我們在驅動內部實現了更加精細化的GPU引擎之間的依賴管理,在解碼和3D特效之間需要依賴的地方才加等待。這樣可以避免很多引擎之間的空等現象,視頻導出性能提升達到10%,對應用戶導出時間也可以減少10%。”英特爾GPU軟件工程師表示。
針對剪映特效導出的優化是重點也是難點,與其它視頻剪輯軟件不同,剪映最初是移動端的軟件,后來才有PC端的剪映專業版,所以剪映使用的是流行的跨平臺技術移動端OpenGL ES。

但在PC端沒有原生的OpenGL ES驅動,“針對這個特別的軟件棧,我們和剪映密切合作,把銳炫顯卡當中的內存壓縮技術應用到軟件棧當中,解決了顯存帶寬壓力的問題,現了剪映特效著色器(Shader)性能近一倍的提升,滿足了剪映OpenGL ES on D3D11軟件棧與英特爾銳炫顯卡的充分適配。”英特爾GPU軟件工程師介紹。
除了專業視頻剪輯軟件,面對當下火熱的生成式AI,英特爾也在為創作者進行了許多工作。
基于英特爾 OpenVINO,AI繪圖開源模型Stable Diffusion可以使用開源圖片編輯軟件GIMP在英特爾銳炫A750、A770等顯卡上流暢運行,簡單的文本輸入就能智能實現創意繪圖。

對于英特爾來說,獨立顯卡的路還很長,需要持續和游戲引擎提供商、游戲工作室、內容創作開發者、AIC廠商等緊密合作,才能打造出更具競爭力的GPU產品。
現在,游戲玩家和內容創作者可以購買到英特爾公版顯卡以及來自宏碁、華擎、藍戟等合作伙伴提供的顯卡。
顯然,英特爾的獨立顯卡為大量玩家提供了一個更具性價比的選擇,多一個高性價比的選擇對游戲玩家和內容創作者來說總是一件值得慶幸和期待的事情。雷峰網(公眾號:雷峰網)
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。