大家好,我是昭華凋
618 大促相信對于眾多 DIY 玩家來說是個攢硬件的好日子,作為裝機大頭的顯卡應(yīng)該有不少朋友都在關(guān)注。而作為老黃家的次旗艦 nvdida RTX 4080 SUPER ,想來也有不少小伙伴既想入手,又糾結(jié)于性能價格是否對等。
有鑒于此,我也利用手頭的索泰 RTX 4080 SUPER 顯卡做了幾項測試,順便分享下個人對 RTX 4080 SUPER 定位看法。
RTX 40 系列顯卡這次采用了全新的 NVIDIA Ada Lovelace 架構(gòu),以早期計算先驅(qū)Ada Lovelace 的名字命名。工藝采用定制 TSMC 4N NVIDIA工藝,核心面積從上一代的 628.4mm2 縮小到 608.5mm2,晶體管數(shù)量從上一代的 283 億個提升至 763 億個。最恐怖的是核心面積一直在縮小的同時晶體管數(shù)目保持夸張的增長速度,同時功耗也持平甚至更低于上代。
不同于上代 4080 殘血 AD103 - 300 核心,4080S 是真滿血版本 AD103 - 400 ,擁有完整的 80 組 SM 單元、流處理器多了 512 顆。此外顯存位寬不變的情況下,顯存頻率提升到了 23Gbps(22.4Gbps),帶寬上升到了 736GB/s(717GB/s)。
從數(shù)據(jù)方面來看,RTX 4080 SUPER 領(lǐng)先 4080 大概 5% 左右,不過反映到實際游戲場景,提升大概在 2% ~ 3% 左右。不過這都不是重點,重點是RTX 4080 SUPER的發(fā)售價比RTX 4080 還低了約 16.7%,增量降價沒跑了
經(jīng)常有朋友問我這個問題,所以單獨拿出來說 一 說
先說結(jié)論
2K 分辨率,主流單機大作采用中高畫質(zhì),4060TI 級別的顯卡完全沒問題
4K分辨率,主流單機大作采用高畫質(zhì),4070TI / SUPER 級別的顯卡都可以應(yīng)對,游戲性能大概比 4070Ti 強 11% 追求高刷就開 DLSS3 性能檔,或者關(guān)閉幾個影響畫質(zhì)的選項
整個 SUPER 系列,我最推薦的就是 4080 SUPER
4070 SUPER 性能上提升最大,但顯存拉了后腿,適合預(yù)算有限的朋友
4070TI SUPER 要好很多,顯存來到了 16GB,玩游戲不容易爆顯存;支持雙視頻編碼器協(xié)同工作,我之前做過與 30900TI 的達芬奇輸出測試,速度會提升一倍以上,但是性價比最低
4080 SUPER 的優(yōu)勢在于滿血 AD103 - 400 核心,等效頻率 22.4GHz ,甚至超過了 RTX 4090 的 21GHz。算力方面提供了高達 52 TFLOPS、121 RT TFLOPS 以及 836 AI TOPS,可以更好的滿足游戲生產(chǎn)力用戶。最重要的是 618 期間價格已經(jīng)干到 8K 以內(nèi),相比 4070 SUPER 價差不大但性能提升巨大。
再來談?wù)勑吞栠x購,就我看來,一 線品牌性能釋放都差不多,SUPER 系列在功耗上也和 40 系保持 一 致,像 4080 SUPER 滿載也不過 320W,散熱壓力并不大,所以我認為選購時性價比是最應(yīng)該考慮的因素,其次下來則是品牌口碑、售后、散熱以及設(shè)計等因素。
下圖是網(wǎng)上搜集的各品牌 4080 SUPER 用料表(并未涵蓋所有)
本次測試的主角是索泰 RTX 4080 SUPER 16GB TRINITY OC 月白,推薦理由里很簡單。
▼索泰 RTX 4080 SUPER 16GB TRINITY OC 月白,和天啟系列同為它家次旗艦(再往上就是 AMP 和 PGF )。相比公版卡來說基頻相同,但核心頻率提升到了 2565MHz。由于沒有進行過于激進的官方超頻,因此,這塊卡可能是目前市場上價格最實惠的白色 RTX 4080 SUPER 顯卡之 一。
▼索泰 RTX 4080 SUPER 16GB TRINITY OC 月白基于三風(fēng)扇設(shè)計,純白配色,轉(zhuǎn)角采用曲線過渡顯得較為圓潤。三 只直徑 90mm 的“仿生盾鱗2.0”風(fēng)扇,不僅加大了扇葉面積,而且利用鱗狀仿生條紋和特殊定制的曲率,優(yōu)化風(fēng)扇的進氣風(fēng)道,起到增加風(fēng)壓、減小亂流的效果。
▼風(fēng)扇支持支持智能啟停技術(shù),可以在高、低溫度和負載之間讓風(fēng)扇智能啟停,減小噪音,增加顯卡壽命。同時,用戶還可以利用索泰的 FireStorm 軟件來自定義風(fēng)扇的轉(zhuǎn)速和性能曲線,以適應(yīng)不同的使用場景和個人喜好。
▼顯卡頂部設(shè)計了一個醒目的鏤空品牌標(biāo)識,內(nèi)部鋪設(shè)了名為“虹橋幻影”的大型 RGB 燈帶,高達 1670 萬種顏色的自定義設(shè)置,可以通過 FireStorm 軟件進行個性化調(diào)整,以滿足不同場景下的工作模式需求。
▼顯卡內(nèi)部是索泰自家的 IceStorm3.0 散熱系統(tǒng),由仿生盾鱗 2.0 三風(fēng)扇、7 條 6mm 鍍鎳熱管以及加厚型散熱模組構(gòu)成,配合 11 + 2 相的供電設(shè)計,可以很輕松壓制顯卡產(chǎn)生的熱量。
▼顯卡背部是從 一 體成型合金背板,金屬背板不僅增強了顯卡的結(jié)構(gòu)穩(wěn)定性和電氣性能,特殊的尾部的通風(fēng)孔設(shè)計有助于提高散熱器的空氣流動,從而提升散熱效率。
▼30.7 * 59 * 12cm 的尺寸、2.5 卡槽占用,在同規(guī)格顯卡陣營堪稱纖細,可以更好的適配小尺寸機箱。
▼本次測試平臺如下,處理器是 Intel Core? i7 14700KF,搭配 Z790 小雕,足以保證不拉后腿。
▼游戲加加性能跑分,總體得分 190056、工作站性能 M-374557。CPU單核性能評分 39492分、CPU多核性能評分 583500分、GPU性能評分 148380分、 得到了“S”級評價。
▼首先是 3D Mark Fire Strike,這是一項適用于高性能游戲電腦和超頻系統(tǒng)的 DirectX 11 基準測試,其統(tǒng) 一 的打分機制對于不同設(shè)備的性能比較很有參考。實測下來,索泰 RTX 4080 SUPER 16GB TRINITY OC 月白的總得分為 51976 分,其中顯卡分數(shù) 64417分,預(yù)估在【荒野大鏢客2】游戲最高畫質(zhì)下可跑到 130+FPS 以上的好成績。
▼而 4K 版本的 Fire Strike Ultra,顯卡得到了17959 分,,其中顯卡分數(shù) 17469分,預(yù)估在【荒野大鏢客2】游戲最高畫質(zhì)下可跑到 105+FPS 以上的好成績。此時 GPU 最高溫度 45.04°C,GPU 負載 38.99%,GPU 時鐘頻率 2760MHz.
▼Time Spy 則是針對 DirectX 12 游戲設(shè)計的基準測試,支持原生 API 功能,比如如異步計算,多顯卡適配器技術(shù)和多線程。實測下來,索泰 RTX 4080 SUPER 16GB TRINITY OC 得分為 27470 分,其中顯卡分數(shù)為 28339 分,預(yù)估【戰(zhàn)地5】最高畫質(zhì)下可以跑到 200+FPS 。
▼Time Spy Extreme 作為進階版,看重的是 4K 分辨率下 DirectX 12 的游戲性能測試。實測下來顯卡得分為 6297 分,其中顯卡分數(shù)為 6068分,預(yù)估【戰(zhàn)地5】最高畫質(zhì)下可以跑到 135+FPS ,
▼針對實時光線追蹤的【Port Royal】總分 18110分,大力水手關(guān)閉 40.21FPS,開啟能跑到 134.79FPS,提升極為明顯。
▼賽博朋克作為少有的同時支持 INA 三家超分辨率技術(shù),以及光追與 DLSS 3 技術(shù)的單機大作,自然不能錯過測試。在默認的 4K 分辨率 / 超級光追模式下 平均幀率 能做到 113.90FPS,最小幀率都能跑到 80FPS 以上。
▼設(shè)置不變,僅將“大力水手”切換到性能檔,平均幀率來到 148.81FPS,最小幀率也來到了 128FPS 以上。
▼極限競速:地平線 5 在 4K 分辨率,預(yù)設(shè)極端模式下,平均幀率 122FPS,最低幀率 113FPS
▼原設(shè)置不變,開啟NVIDIA DLSS AI 超分辨率(超高性能)、DLAA關(guān)閉、開啟幀生成技術(shù),平均幀率 166幀,最低幀率,主打流暢二字。
▼育碧的 3A 大作刺客信條.幻境,這游戲的優(yōu)化著實喜人,但最高只支持 nvdida DLSS2 技術(shù).雖然有國外網(wǎng)友開發(fā)了 DLSS 3 幀生成 MOD,但使用之后游戲內(nèi)置的 benchmark 就無法運行。這里我測試的 4K 分辨率最高畫質(zhì),游戲平均幀率達到了 101FPS,最低 1% 也有 83FPS。
▼溫度測試環(huán)節(jié),利用 Furmark 對 索泰 RTX 4080 SUPER 月白進行烤雞,在負載拉滿的情況下,顯卡最高功耗跑到了 320W 左右,完美對應(yīng)標(biāo)稱數(shù)據(jù)。此時 GPU 表面溫度 76°C 左右、熱點溫度 90°C 左右,考慮到顯卡本身并沒有做夸張的散熱設(shè)計,這個溫度控制應(yīng)該算是相當(dāng)完美。
40 系顯卡價格偏高,最重要的原因它不是純游戲卡,對于跑 AI 的朋友來說更是妥妥的生產(chǎn)力需求。
為什么說 N 卡最適合跑 AIGC?
▼確切來講,AIGC 技術(shù)并不局限于 NVIDIA顯卡 ,但目前大多數(shù)加速計算環(huán)境是基于 CUDA 構(gòu)建的,而 CUDA 是 NVIDIA 開發(fā)的技術(shù),NVIDIA的 GPU 擁有卓越的并行處理能力和針對 AI 工作負載優(yōu)化的架構(gòu)。例如,NVIDIA 的 DLSS 技術(shù),它通過 AI 生成額外的幀來提升游戲和應(yīng)用程序的渲染性能,這就是 AIGC 技術(shù)的 一 個應(yīng)用實例。此外,市面常見的 AIGC 模型都是用 N 卡跑出來的,所以硬件兼容度也是最高的。
▼我之前出過一篇利用 Stable Diffusion 跑本地 AI 繪圖的文章,相比流行的 Midjourney(Mid)來說,Stable Diffusion 可以進行本地部署,部署完畢可以免費無限次使用,沒有使用成本,在圖像質(zhì)量和用戶可控性都更高。但也因為需要本地跑圖,所以對硬件有一定的要求,尤其是 GPU,推薦至少 4GB 顯存的顯卡,8GB 及以上顯存可以獲得更好的性能。
▼本次 AI 繪圖測試同樣基于 Stable Diffusion 本地模型,評測之前先和大家分享下索泰 RTX 4080 SUPER 的優(yōu)勢
眾所周知,在 AI 繪圖領(lǐng)域,核心數(shù)量主要決定計算的快慢,顯存大小則決定分辨率、模型以及批次數(shù)量的上限。
對于 SD 來說,12GB 顯存已經(jīng)可以滿足日常圖像繪制的需求,不過如果你喜歡嘗試不同的插件、擴展、乃至相互組合生圖
那么 16GB 可以更好的保證不出現(xiàn)爆顯存的風(fēng)險。
更別提現(xiàn)在流行的視頻生成項目,這可比生成靜態(tài)圖片所需顯存要求可大了一截
所以,選擇大顯存不僅是速度更快,而且在其他項目的嘗試也能更加的自由
▼本次 AI 測試基于秋葉aaaki 大佬的整合包和 SDXL 大模型,首先做哈準備工作
顯存優(yōu)化這里,如果是 >12GB 顯存就選無優(yōu)化,
然后關(guān)閉下方的 VAE 半精度優(yōu)化
▼進入 Stable Diffusion ,先來到系統(tǒng)信息 - 基準測試跑個分
索泰 RTX 4080 SUPER 16GB TRINITY OC 月白在默認模型下跑出了 16.49it/s、24.56it/s、28.14it/s
這是什么水準呢,從跑分天梯圖來看就是妥妥的第二名(排名僅供參考,數(shù)據(jù)量目前很少)
▼換成 SDXL 大模型 + SDXL VAE 的組合,分數(shù)就會驟降到 6.41it/s、11.73it/s、19.53it/s
要知道,這還是優(yōu)化相對算好的高質(zhì)量模型,想想要是用優(yōu)化普通的模型 + LORA + 額外擴展的組合,渲染量一大不崩才怪。
這應(yīng)該就是高端卡的優(yōu)勢所在 ~ 生產(chǎn)力!
▼使用 SDXL 1.0 模型、搭配 sxdl/VAE 模型,采樣方法: DPM++2MSDE、迭代步數(shù):60;圖片寬度:1024;圖片長度:1024;總批次數(shù):1;單批數(shù)量:8。
▼耗時 1 分 56秒,顯存最高達到了 13.3GB,基本上 4070TI SUPER 以下陣亡了。
成品圖
▼不僅如此,Nvidia 還專門推出了用于加速 AI 矩陣運算 的 Tensor Cores ,這是一個針對深度學(xué)習(xí)推理的高性能 GPU 加速器,它可以自動對神經(jīng)網(wǎng)絡(luò)模型進行優(yōu)化,提高運行速度并降低內(nèi)存占用。
▼在 Stable Diffusion 中使用相同的提示詞,一次生成 20 張圖片,對比 Tensor Cores 加速前后耗時
▼Tensor Cores 加速前后,生成時間從 2 分 36 秒縮短到了 1 分 43 秒,加速實際效果達到了 51%。
這還只是用的基礎(chǔ)模型庫,關(guān)鍵字等各項參數(shù)也不復(fù)雜,換成高分辨率輸出和多模型組合的話,這個差距只會越來越大。
而這才是老黃卡不愁賣的根本原因,生產(chǎn)力永遠是核心需求。
增量減價,堪稱良心,這是我對 Nvdida RTX 4080 SUPER 顯卡的看法。游戲性能相較于 RTX 4080 有 2%~10% 提升,可以很輕松滿足 3A 大作對畫質(zhì)和幀率的需求,滿血版 AD103 核心和 16GB 的超大顯存,對于需要進行視頻編輯、3D建模等高負載任務(wù)的生產(chǎn)力用戶來說,簡直就是雪中送炭。大顯存意味著你可以同時打開更多的應(yīng)用,處理更大的文件,而不會感受到絲毫的卡頓。
索泰 RTX 4080 SUPER 16GB TRINITY OC 月白則是家用游戲顯卡的典范。小巧纖細的機身,可以輕松適配各種小型機箱,讓你的桌面空間不再受限。而且,它并沒有因為體積小而犧牲性能,對比某些品牌用夸張的造型、過分的堆料來強行提高價格,索泰這樣的做法無疑才是真正為玩家著想。
PS:發(fā)文前突然發(fā)現(xiàn)的福利:
國產(chǎn)3A游戲之光《黑神話:悟空》即將于8月20日正式發(fā)售,恰逢當(dāng)下618年中購物狂歡節(jié),索泰攜手NVIDIA給玩家們送福利啦,沒錯,就是送《黑神話:悟空》WeGame平臺標(biāo)準版游戲(價值268元)。
即日起至2024年6月18日,在指定店鋪購買索泰 GeForce RTX 4070及以上顯卡或電腦整機,即可申領(lǐng)《黑神話:悟空》游戲兌換碼。
兌換碼數(shù)量有限,先到先得,贈完即止。