大家好,我是波導(dǎo)終結(jié)者。
前陣子跟大家分享了4070跑AI生產(chǎn)力后,很多朋友感興趣,都來咨詢我裝機(jī)方案,畢竟不是每個(gè)人預(yù)算都是無限的。小伙伴1號(hào),公司主要業(yè)務(wù)是媒體相關(guān),經(jīng)常有大量的視頻需要轉(zhuǎn)碼壓縮,時(shí)間倒不是非常緊,但量大電費(fèi)貴,希望有最高的能耗比;小伙伴2號(hào),個(gè)人業(yè)余愛好是配音,已經(jīng)在喜馬拉雅有號(hào),希望AI人聲分離能搞定更多更好的背景音源;小伙伴3號(hào),公司希望AI繪畫能承擔(dān)一部分的圖片繪畫原創(chuàng)工作,畢竟現(xiàn)在原畫非常貴。 這幾位對(duì)性價(jià)比,功耗,以及綜合效率都有一定的要求。今天我就詳細(xì)測(cè)試一下40系的顯卡到底適不適合。
我自己工作室的兩臺(tái)電腦都是實(shí)打?qū)嵉母苫钣?,自認(rèn)配置均衡,會(huì)比只用來評(píng)測(cè)的極端配置更貼合實(shí)際使用需求。機(jī)子1:10700K+Z490+3080Ti,系統(tǒng)WIN10最新,驅(qū)動(dòng)Game Ready 531.41,機(jī)子2:12700K+Z690+4070,系統(tǒng)WIN11最新,驅(qū)動(dòng)Studio。3080Ti是前兩年公司業(yè)務(wù)剛需買的技嘉魔鷹,那時(shí)候算是高點(diǎn)了,24期到現(xiàn)在還在還,4070是前段時(shí)間入手的技嘉風(fēng)魔,算是最基礎(chǔ)的版本了。先拋開游戲,在生產(chǎn)力方面,4070真的已經(jīng)碾壓前代次旗艦了嗎?直接來看。
由于不同人對(duì)噪音的感知度不同(上次甚至有神仙說自己高于30分貝就會(huì)被吵得睡不著,emmmm),并且我沒有專業(yè)的噪音儀(有人杠說民用千元以下和手機(jī)測(cè)都不準(zhǔn)),蓋不蓋側(cè)板,離得多近測(cè)也會(huì)對(duì)結(jié)果產(chǎn)生很大影響。所以我干脆不測(cè)噪音了,顯卡滿載還想個(gè)桃子的靜音。先來看3080Ti跑甜甜圈,默認(rèn)功耗墻是350W,我懶得去調(diào),已經(jīng)撞了,核心跑不滿。
4070,功耗200W,也是沒有跑滿核心頻率。不過某一方面滿了之后,繼續(xù)往上邊際效應(yīng)明顯,不必糾結(jié)。我看不少朋友糾結(jié)烤機(jī)的時(shí)候哪個(gè)頻率沒滿,大可不必??玖艘恍r(shí)多的機(jī),就穩(wěn)定在這里了,后面的測(cè)試也均以單項(xiàng)目1小時(shí)為準(zhǔn)。
另,軟件顯示的功率應(yīng)該是從主板獲得的,而主板是由內(nèi)部電路測(cè)得的,理論上已經(jīng)很準(zhǔn)確。但為了防杠,我還特地使用了功率計(jì)佐以驗(yàn)證,軟件與儀器基本一致,并未出現(xiàn)大的偏差。以上。
剛才聊到頻率的問題,是的,現(xiàn)在的顯卡是一個(gè)很大的綜合體,除了核心和顯存外,還有編碼解碼,物理引擎,AI,光追等很多東西在里面,只要運(yùn)行正常,就不必老想著頻率跑滿。比如這里,我使用4070來進(jìn)行H264硬編碼,可以看到,速度倍率在8.95倍,核心頻率直接拉滿到2790MHz,而此時(shí)的整卡功耗只有53.8瓦,基本上在52-55左右。編碼的時(shí)候從GPU-Z里也能看到,Video Engine Load已經(jīng)拉滿到100%。最夸張的是,核心溫度竟然不足50度,風(fēng)扇根本不工作。我多次確認(rèn)過,確實(shí)就是溫度太低,風(fēng)扇不轉(zhuǎn),活正常在干。
3080Ti這里,就差得有點(diǎn)多了。首先是速度只有7.61倍,功耗拉到了150W左右,風(fēng)扇也以62%左右的速度在運(yùn)轉(zhuǎn)。最令我驚訝的還是速度,因?yàn)橐肁V1編碼,用的是最新版本的FFmpeg,也不知道是40系的第八代NVENC優(yōu)化太好了,還是FFmpeg喜新厭舊,對(duì)舊顯卡的優(yōu)化已經(jīng)不上心了?
總之,我把轉(zhuǎn)碼方面都跑了一遍,由于圖片太多,看起來也乏味,這里直接整理成圖表給大家看??梢钥吹剑?個(gè)項(xiàng)目的轉(zhuǎn)碼測(cè)試當(dāng)中,4070的功耗都只有50多瓦,速度都接近了9倍速,最夸張的就是風(fēng)扇從來沒轉(zhuǎn)過,核心頻率拉滿而核心溫度始終低于50度。相較之下,3080Ti的兩個(gè)項(xiàng)目的功耗在150瓦左右,速度只有6-7倍,風(fēng)扇以60%左右的速度運(yùn)轉(zhuǎn),核心和顯存的溫度也更高。
那么對(duì)于小伙伴1號(hào)來說,換4070確實(shí)是非常劃算的,風(fēng)扇不轉(zhuǎn),只有1/3的能耗,速度反而快了一半多。幾十臺(tái)機(jī)子長時(shí)間跑的話,電費(fèi)很快就能掙回來。
PS:實(shí)際上3080Ti在10700K全核5G下跑,只有5.8倍左右,CPU軟解占用直接來到了80%。由于我不太相信CUDA等賬面參數(shù)將近翻倍的3080Ti比4070還要慢,實(shí)際上轉(zhuǎn)碼部分的測(cè)試我是把兩張顯卡都插12代這臺(tái)上跑的,除了顯卡所有其他條件全都一樣。雖然成績有所提高,但仍然是4070更快,此案終結(jié)。其他項(xiàng)目基本不怎么吃CPU,不再重復(fù)測(cè)試。
因?yàn)檐浖?、音視頻這方面我比較精通,小伙伴2號(hào)同時(shí)還委托我測(cè)試一件事,就是UVR5直接從視頻里扒,與將視頻里的音頻扒出來再處理,是否有差別。這里測(cè)試結(jié)果是:沒差別。仍然使用我自己錄制的H265,4K游戲視頻實(shí)況,共1小時(shí)來測(cè)試,直接處理視頻耗時(shí)5分07秒,處理純音頻耗時(shí)4分28秒。但因?yàn)槭謩?dòng)把視頻里的音頻分離出來,也要半分鐘左右,則可以認(rèn)為分不分離音頻都沒關(guān)系,軟件自動(dòng)會(huì)處理。
另外,友情提示,UVR5僅是扒個(gè)50M的純音頻,也在某一步驟要吃掉12G以上的內(nèi)存,所以干活用的朋友們,真的32G內(nèi)存現(xiàn)在只是起步了。
從顯卡的占用曲線可以看到,人聲分離的處理是分步驟的,不像轉(zhuǎn)碼那么純粹的可以吃滿。3080Ti大部分情況下功耗在105-110瓦左右,偶爾飆上250W一小段時(shí)間,很快又回落。處理一個(gè)1小時(shí)的文件,平均功耗在122.13瓦左右。4070一樣很夸張,風(fēng)扇仍然不轉(zhuǎn),平均功耗41.7瓦。
太多的數(shù)據(jù)和截圖仍然匯總成圖表。UVR5對(duì)于內(nèi)存的占用奇大,估計(jì)是模型需要載入內(nèi)存吧,對(duì)于顯存的占用,基本在5G以下,可以忽略,反正夠用。這軟件應(yīng)該是比較依賴核心頻率的,吃不滿功耗墻,速度基本就看核心最高能飆到多少。但由于不是每個(gè)步驟都吃滿,總耗時(shí)差別又不那么大。雖然領(lǐng)先沒有那么大了,但不管從哪方面考慮,4070仍然都是更好的選擇。
聲明,本測(cè)試仍然使用默認(rèn)模型,生成非真人內(nèi)容。了解更多請(qǐng)移步評(píng)論區(qū)或其他地方。這里我讓引擎生成N張貓吃甜甜圈的圖片,可以看到挺有趣的,右邊這張呃……好吧,貓貓蟲和毛毛蟲等同了。
監(jiān)控GPU-Z圖表可以看到stable diffusion的工作流程,一批一批的。3080Ti平時(shí)大部分時(shí)間功耗在190W左右,顯存吃滿12G,隔一段時(shí)間飆到350W滿,顯存釋放一大半。因?yàn)檐浖墓ぷ髁鞒淌敲颗蒒張圖,生成M批,估計(jì)一次性太多會(huì)爆顯存,所以分批次來了。
從圖表和GPU-Z中可以看到,AI繪圖時(shí)核心頻率一直工作在很高但不滿的水平,顯存占用根據(jù)圖片數(shù)量會(huì)越來越多,功耗大概有85%左右的時(shí)間只吃到一半出頭,剩下的時(shí)間會(huì)周期性的飆滿。鑒于4070的表現(xiàn)一樣全面勝出,該選什么卡不用我說了吧。
既然測(cè)試了,那就干脆把之前搞的幾個(gè)項(xiàng)目一起再試一遍吧。這里一樣是跑Whisper,3080Ti平均功率在214.31W,大部分時(shí)間在211W左右浮動(dòng),有時(shí)候會(huì)飆得很高,但瞬間又軟下來了。4070類似,只是各項(xiàng)功耗均低了不少。
AI語音轉(zhuǎn)文字關(guān)于直接拿視頻扒,以及分離音頻之后再扒的結(jié)果,與人聲分離類似,并不影響效率,可以放心直接處理視頻,這里就不再贅述。這里我還有個(gè)想法,可能以后干活也用得著,就是把人聲分離與語音轉(zhuǎn)文字結(jié)合起來,就能排除背景音樂和其他干擾,把一個(gè)視頻里的語言全部轉(zhuǎn)換為文字了。
話先說在前頭,Topaz Video AI并不是簡(jiǎn)單的放大銳化,是依賴AI算法與模型補(bǔ)充細(xì)節(jié)的,所以速度很慢,目前每秒只有3幀左右。這里可以看到,顯存占用并不大,但是核心頻率一陣一陣的拉滿。4070處理1小時(shí)下來,最低功耗33.6瓦,最高功耗140.4瓦,平均功耗71.74瓦。
看到這可能有的朋友要問,這些數(shù)據(jù)怎么來的呢?GPU-Z左下角的Log to file勾上,有完整的Excel,拉個(gè)公式就有啦。
因?yàn)樗俣忍?,效率就不提了。這東西目前屬于可用,但極慢,需要等以后繼續(xù)優(yōu)化。而且值得一提的是,如上面的GPU-Z截圖,4070實(shí)際上有1/3左右的時(shí)間風(fēng)扇是不轉(zhuǎn)的,但是圖表很難表現(xiàn)出來,不折騰了,就提一嘴。
有的人可能會(huì)問我,為什么要那么在意溫度,功耗,風(fēng)扇和噪音呢?噪音這東西,風(fēng)扇聲肯定有,但我并不覺得吵,因?yàn)槊總€(gè)人感受不同,不好定義,反正這兩張卡我都不覺得吵。功耗這東西,如果你自己交電費(fèi),或者家里、公司交電費(fèi)的人會(huì)來找你麻煩,你就知道了。溫度更不用說了,越低越好嘛,不少朋友要搞ITX之類的,性能和價(jià)格差不多的話,干嘛不要更安靜溫度更低的呢?
4070的游戲性能已經(jīng)有很多測(cè)試了,在3080水平左右,比3080Ti還是差一截。而看賬面數(shù)據(jù),除了頻率高一些以外,其他不少參數(shù)都“縮水”不少,比如4070配置有5888個(gè)CUDA核心,64個(gè)光柵單元、184個(gè)紋理單元,相較于3080Ti的10240個(gè)CUDA核心,112個(gè)光柵單元、320個(gè)紋理單元簡(jiǎn)直只有一半左右。但實(shí)際生產(chǎn)力表現(xiàn)上,4070卻絲毫不虛。當(dāng)然咱們可以說,因?yàn)橐粋€(gè)是10700K一個(gè)是12700K平臺(tái)不同,沒有錯(cuò),但真實(shí)的應(yīng)用場(chǎng)景就是這樣子的,我實(shí)際上干活就是10代配30系,12代配40系;轉(zhuǎn)碼項(xiàng)目我也挪到了同一平臺(tái)上,仍然是4070全面勝出。而且正如UVR5那張任務(wù)管理器截圖中所看到的那樣,因?yàn)榇蟛糠猪?xiàng)目跑的都是顯卡加速,實(shí)際上CPU占用率并不高,根本不成為瓶頸。
最顛覆性的,還是新一代顯卡超低的功耗和發(fā)熱,以及很多時(shí)候風(fēng)扇根本不轉(zhuǎn)這件事,再加上整張顯卡的長也只有300mm,很適合塞一些ITX之類的。這次618有小降一點(diǎn),想玩玩各種AI的或者公司干活有需求的都是時(shí)候入手了。
感謝觀看,喜歡的朋友幫忙點(diǎn)個(gè)贊和關(guān)注吧,我們下期再見。