首頁 / 原創(chuàng) / 電腦數(shù)碼/ 電腦配件/ 顯卡/ 正文

#618好物嗨購節(jié)#4070 大戰(zhàn) 3080Ti，AI生產(chǎn)力誰更強(qiáng)

顯卡 06-14 16:59:05 52 0

大家好，我是波導(dǎo)終結(jié)者。

前陣子跟大家分享了4070跑AI生產(chǎn)力后，很多朋友感興趣，都來咨詢我裝機(jī)方案，畢竟不是每個(gè)人預(yù)算都是無限的。小伙伴1號(hào)，公司主要業(yè)務(wù)是媒體相關(guān)，經(jīng)常有大量的視頻需要轉(zhuǎn)碼壓縮，時(shí)間倒不是非常緊，但量大電費(fèi)貴，希望有最高的能耗比；小伙伴2號(hào)，個(gè)人業(yè)余愛好是配音，已經(jīng)在喜馬拉雅有號(hào)，希望AI人聲分離能搞定更多更好的背景音源；小伙伴3號(hào)，公司希望AI繪畫能承擔(dān)一部分的圖片繪畫原創(chuàng)工作，畢竟現(xiàn)在原畫非常貴。這幾位對(duì)性價(jià)比，功耗，以及綜合效率都有一定的要求。今天我就詳細(xì)測(cè)試一下40系的顯卡到底適不適合。

我自己工作室的兩臺(tái)電腦都是實(shí)打?qū)嵉母苫钣?，自認(rèn)配置均衡，會(huì)比只用來評(píng)測(cè)的極端配置更貼合實(shí)際使用需求。機(jī)子1：10700K+Z490+3080Ti，系統(tǒng)WIN10最新，驅(qū)動(dòng)Game Ready 531.41，機(jī)子2：12700K+Z690+4070，系統(tǒng)WIN11最新，驅(qū)動(dòng)Studio。3080Ti是前兩年公司業(yè)務(wù)剛需買的技嘉魔鷹，那時(shí)候算是高點(diǎn)了，24期到現(xiàn)在還在還，4070是前段時(shí)間入手的技嘉風(fēng)魔，算是最基礎(chǔ)的版本了。先拋開游戲，在生產(chǎn)力方面，4070真的已經(jīng)碾壓前代次旗艦了嗎？直接來看。

單烤功耗

由于不同人對(duì)噪音的感知度不同（上次甚至有神仙說自己高于30分貝就會(huì)被吵得睡不著，emmmm），并且我沒有專業(yè)的噪音儀（有人杠說民用千元以下和手機(jī)測(cè)都不準(zhǔn)），蓋不蓋側(cè)板，離得多近測(cè)也會(huì)對(duì)結(jié)果產(chǎn)生很大影響。所以我干脆不測(cè)噪音了，顯卡滿載還想個(gè)桃子的靜音。先來看3080Ti跑甜甜圈，默認(rèn)功耗墻是350W，我懶得去調(diào)，已經(jīng)撞了，核心跑不滿。

4070，功耗200W，也是沒有跑滿核心頻率。不過某一方面滿了之后，繼續(xù)往上邊際效應(yīng)明顯，不必糾結(jié)。我看不少朋友糾結(jié)烤機(jī)的時(shí)候哪個(gè)頻率沒滿，大可不必?？玖艘恍r(shí)多的機(jī)，就穩(wěn)定在這里了，后面的測(cè)試也均以單項(xiàng)目1小時(shí)為準(zhǔn)。

另，軟件顯示的功率應(yīng)該是從主板獲得的，而主板是由內(nèi)部電路測(cè)得的，理論上已經(jīng)很準(zhǔn)確。但為了防杠，我還特地使用了功率計(jì)佐以驗(yàn)證，軟件與儀器基本一致，并未出現(xiàn)大的偏差。以上。

轉(zhuǎn)碼測(cè)試

剛才聊到頻率的問題，是的，現(xiàn)在的顯卡是一個(gè)很大的綜合體，除了核心和顯存外，還有編碼解碼，物理引擎，AI，光追等很多東西在里面，只要運(yùn)行正常，就不必老想著頻率跑滿。比如這里，我使用4070來進(jìn)行H264硬編碼，可以看到，速度倍率在8.95倍，核心頻率直接拉滿到2790MHz，而此時(shí)的整卡功耗只有53.8瓦，基本上在52-55左右。編碼的時(shí)候從GPU-Z里也能看到，Video Engine Load已經(jīng)拉滿到100%。最夸張的是，核心溫度竟然不足50度，風(fēng)扇根本不工作。我多次確認(rèn)過，確實(shí)就是溫度太低，風(fēng)扇不轉(zhuǎn)，活正常在干。

3080Ti這里，就差得有點(diǎn)多了。首先是速度只有7.61倍，功耗拉到了150W左右，風(fēng)扇也以62%左右的速度在運(yùn)轉(zhuǎn)。最令我驚訝的還是速度，因?yàn)橐肁V1編碼，用的是最新版本的FFmpeg，也不知道是40系的第八代NVENC優(yōu)化太好了，還是FFmpeg喜新厭舊，對(duì)舊顯卡的優(yōu)化已經(jīng)不上心了？

總之，我把轉(zhuǎn)碼方面都跑了一遍，由于圖片太多，看起來也乏味，這里直接整理成圖表給大家看?？梢钥吹剑?個(gè)項(xiàng)目的轉(zhuǎn)碼測(cè)試當(dāng)中，4070的功耗都只有50多瓦，速度都接近了9倍速，最夸張的就是風(fēng)扇從來沒轉(zhuǎn)過，核心頻率拉滿而核心溫度始終低于50度。相較之下，3080Ti的兩個(gè)項(xiàng)目的功耗在150瓦左右，速度只有6-7倍，風(fēng)扇以60%左右的速度運(yùn)轉(zhuǎn)，核心和顯存的溫度也更高。

那么對(duì)于小伙伴1號(hào)來說，換4070確實(shí)是非常劃算的，風(fēng)扇不轉(zhuǎn)，只有1/3的能耗，速度反而快了一半多。幾十臺(tái)機(jī)子長時(shí)間跑的話，電費(fèi)很快就能掙回來。

PS:實(shí)際上3080Ti在10700K全核5G下跑，只有5.8倍左右，CPU軟解占用直接來到了80%。由于我不太相信CUDA等賬面參數(shù)將近翻倍的3080Ti比4070還要慢，實(shí)際上轉(zhuǎn)碼部分的測(cè)試我是把兩張顯卡都插12代這臺(tái)上跑的，除了顯卡所有其他條件全都一樣。雖然成績有所提高，但仍然是4070更快，此案終結(jié)。其他項(xiàng)目基本不怎么吃CPU，不再重復(fù)測(cè)試。

AI人聲分離測(cè)試

因?yàn)檐浖?、音視頻這方面我比較精通，小伙伴2號(hào)同時(shí)還委托我測(cè)試一件事，就是UVR5直接從視頻里扒，與將視頻里的音頻扒出來再處理，是否有差別。這里測(cè)試結(jié)果是：沒差別。仍然使用我自己錄制的H265，4K游戲視頻實(shí)況，共1小時(shí)來測(cè)試，直接處理視頻耗時(shí)5分07秒，處理純音頻耗時(shí)4分28秒。但因?yàn)槭謩?dòng)把視頻里的音頻分離出來，也要半分鐘左右，則可以認(rèn)為分不分離音頻都沒關(guān)系，軟件自動(dòng)會(huì)處理。

另外，友情提示，UVR5僅是扒個(gè)50M的純音頻，也在某一步驟要吃掉12G以上的內(nèi)存，所以干活用的朋友們，真的32G內(nèi)存現(xiàn)在只是起步了。

從顯卡的占用曲線可以看到，人聲分離的處理是分步驟的，不像轉(zhuǎn)碼那么純粹的可以吃滿。3080Ti大部分情況下功耗在105-110瓦左右，偶爾飆上250W一小段時(shí)間，很快又回落。處理一個(gè)1小時(shí)的文件，平均功耗在122.13瓦左右。4070一樣很夸張，風(fēng)扇仍然不轉(zhuǎn)，平均功耗41.7瓦。

太多的數(shù)據(jù)和截圖仍然匯總成圖表。UVR5對(duì)于內(nèi)存的占用奇大，估計(jì)是模型需要載入內(nèi)存吧，對(duì)于顯存的占用，基本在5G以下，可以忽略，反正夠用。這軟件應(yīng)該是比較依賴核心頻率的，吃不滿功耗墻，速度基本就看核心最高能飆到多少。但由于不是每個(gè)步驟都吃滿，總耗時(shí)差別又不那么大。雖然領(lǐng)先沒有那么大了，但不管從哪方面考慮，4070仍然都是更好的選擇。

AI繪畫測(cè)試

聲明，本測(cè)試仍然使用默認(rèn)模型，生成非真人內(nèi)容。了解更多請(qǐng)移步評(píng)論區(qū)或其他地方。這里我讓引擎生成N張貓吃甜甜圈的圖片，可以看到挺有趣的，右邊這張呃……好吧，貓貓蟲和毛毛蟲等同了。

監(jiān)控GPU-Z圖表可以看到stable diffusion的工作流程，一批一批的。3080Ti平時(shí)大部分時(shí)間功耗在190W左右，顯存吃滿12G，隔一段時(shí)間飆到350W滿，顯存釋放一大半。因?yàn)檐浖墓ぷ髁鞒淌敲颗蒒張圖，生成M批，估計(jì)一次性太多會(huì)爆顯存，所以分批次來了。

從圖表和GPU-Z中可以看到，AI繪圖時(shí)核心頻率一直工作在很高但不滿的水平，顯存占用根據(jù)圖片數(shù)量會(huì)越來越多，功耗大概有85%左右的時(shí)間只吃到一半出頭，剩下的時(shí)間會(huì)周期性的飆滿。鑒于4070的表現(xiàn)一樣全面勝出，該選什么卡不用我說了吧。

AI語音轉(zhuǎn)文字測(cè)試

既然測(cè)試了，那就干脆把之前搞的幾個(gè)項(xiàng)目一起再試一遍吧。這里一樣是跑Whisper，3080Ti平均功率在214.31W，大部分時(shí)間在211W左右浮動(dòng)，有時(shí)候會(huì)飆得很高，但瞬間又軟下來了。4070類似，只是各項(xiàng)功耗均低了不少。

AI語音轉(zhuǎn)文字關(guān)于直接拿視頻扒，以及分離音頻之后再扒的結(jié)果，與人聲分離類似，并不影響效率，可以放心直接處理視頻，這里就不再贅述。這里我還有個(gè)想法，可能以后干活也用得著，就是把人聲分離與語音轉(zhuǎn)文字結(jié)合起來，就能排除背景音樂和其他干擾，把一個(gè)視頻里的語言全部轉(zhuǎn)換為文字了。

AI視頻放大測(cè)試

話先說在前頭，Topaz Video AI并不是簡(jiǎn)單的放大銳化，是依賴AI算法與模型補(bǔ)充細(xì)節(jié)的，所以速度很慢，目前每秒只有3幀左右。這里可以看到，顯存占用并不大，但是核心頻率一陣一陣的拉滿。4070處理1小時(shí)下來，最低功耗33.6瓦，最高功耗140.4瓦，平均功耗71.74瓦。

看到這可能有的朋友要問，這些數(shù)據(jù)怎么來的呢？GPU-Z左下角的Log to file勾上，有完整的Excel，拉個(gè)公式就有啦。

因?yàn)樗俣忍?，效率就不提了。這東西目前屬于可用，但極慢，需要等以后繼續(xù)優(yōu)化。而且值得一提的是，如上面的GPU-Z截圖，4070實(shí)際上有1/3左右的時(shí)間風(fēng)扇是不轉(zhuǎn)的，但是圖表很難表現(xiàn)出來，不折騰了，就提一嘴。

有的人可能會(huì)問我，為什么要那么在意溫度，功耗，風(fēng)扇和噪音呢？噪音這東西，風(fēng)扇聲肯定有，但我并不覺得吵，因?yàn)槊總€(gè)人感受不同，不好定義，反正這兩張卡我都不覺得吵。功耗這東西，如果你自己交電費(fèi)，或者家里、公司交電費(fèi)的人會(huì)來找你麻煩，你就知道了。溫度更不用說了，越低越好嘛，不少朋友要搞ITX之類的，性能和價(jià)格差不多的話，干嘛不要更安靜溫度更低的呢？

4070的游戲性能已經(jīng)有很多測(cè)試了，在3080水平左右，比3080Ti還是差一截。而看賬面數(shù)據(jù)，除了頻率高一些以外，其他不少參數(shù)都“縮水”不少，比如4070配置有5888個(gè)CUDA核心，64個(gè)光柵單元、184個(gè)紋理單元，相較于3080Ti的10240個(gè)CUDA核心，112個(gè)光柵單元、320個(gè)紋理單元簡(jiǎn)直只有一半左右。但實(shí)際生產(chǎn)力表現(xiàn)上，4070卻絲毫不虛。當(dāng)然咱們可以說，因?yàn)橐粋€(gè)是10700K一個(gè)是12700K平臺(tái)不同，沒有錯(cuò)，但真實(shí)的應(yīng)用場(chǎng)景就是這樣子的，我實(shí)際上干活就是10代配30系，12代配40系；轉(zhuǎn)碼項(xiàng)目我也挪到了同一平臺(tái)上，仍然是4070全面勝出。而且正如UVR5那張任務(wù)管理器截圖中所看到的那樣，因?yàn)榇蟛糠猪?xiàng)目跑的都是顯卡加速，實(shí)際上CPU占用率并不高，根本不成為瓶頸。

最顛覆性的，還是新一代顯卡超低的功耗和發(fā)熱，以及很多時(shí)候風(fēng)扇根本不轉(zhuǎn)這件事，再加上整張顯卡的長也只有300mm，很適合塞一些ITX之類的。這次618有小降一點(diǎn)，想玩玩各種AI的或者公司干活有需求的都是時(shí)候入手了。

感謝觀看，喜歡的朋友幫忙點(diǎn)個(gè)贊和關(guān)注吧，我們下期再見。

#618好物嗨購節(jié)#4070 大戰(zhàn) 3080Ti，AI生產(chǎn)力誰更強(qiáng)

廣告聲明：文中若存在對(duì)外跳轉(zhuǎn)的鏈接（涵蓋商品鏈接、超鏈接、二維碼等各類形式），其目的在于為您呈上更多與內(nèi)容相關(guān)的產(chǎn)品信息，助您迅速甄別。但我們不對(duì)其做任何明示或暗示的保證，煩請(qǐng)您謹(jǐn)慎參考，依據(jù)自身的需求與判斷來做出決策。

作
者