文章內(nèi)容有點(diǎn)硬核和專業(yè),建議先關(guān)注和收藏再看。
大家好,我是波導(dǎo)終結(jié)者。
錄游戲解說(shuō)視頻這么多年,又做了幾年直播,對(duì)視頻這一塊一直在尋求更高效率的方法。當(dāng)年顯卡編碼還剛露頭的時(shí)候,我就做過(guò)嘗試,不過(guò)那個(gè)時(shí)候軟件硬件都不成熟,效果很差。
就跟大家說(shuō)一個(gè)真事兒,當(dāng)時(shí)我用的GTX750,想看看顯卡編碼能不能比CPU快一點(diǎn),搜索CUDA,百度問(wèn)我:你要搜的是不是“粗大”?這是真事兒,可惜硬盤(pán)壞過(guò)一次,截圖沒(méi)了。但是從側(cè)面可見(jiàn),當(dāng)時(shí)搜這個(gè)的人,以及網(wǎng)上的相關(guān)資料確實(shí)是少。當(dāng)年我也試過(guò),那時(shí)候顯卡編碼質(zhì)量較差,碼率浪費(fèi)嚴(yán)重,不是很實(shí)用。
過(guò)了這么多年,相關(guān)的軟硬件已經(jīng)更新了非常多,效果早已可以令人滿意。我也是自己用了這么多年,積累了不少的經(jīng)驗(yàn),慢慢跟大家分享。這幾年我一直用一塊GTX1050Ti來(lái)進(jìn)行顯卡加速,這也是支持新架構(gòu)的最低型號(hào)(確切的說(shuō)應(yīng)該是GTX1050)。丐雖然丐點(diǎn),至少比i7-7700快不少。
最近,我也是更新了一下裝備,i7-10700K+Z490+3070和i5-10400F+B460M+2060的階梯都搭起來(lái)了。本來(lái)是想做一個(gè)從750-1050-2060-3070的階梯測(cè)試,但是前段時(shí)間有恙,后來(lái)也想了想,生產(chǎn)力工具嘛,誰(shuí)不是奔著中高端卡去用的,太丐也沒(méi)啥意義,最后決定直接用10700K和3070來(lái)一篇詳細(xì)測(cè)試了。
CPU是盒裝的10700K,不過(guò)這次先不超頻,貼近一下大部分人的使用場(chǎng)景。顯卡是工作室樓上小伙伴搶到的影馳3070星曜,先找他借過(guò)來(lái)用一段時(shí)間。主板功耗已經(jīng)手動(dòng)開(kāi)到200W,海盜船水冷,CPU睿頻讓它自動(dòng)超。
32G內(nèi)存,3G速度NVMe固態(tài),基本是民用中端往上配置,整機(jī)性價(jià)比算是比較不錯(cuò)的,除了CPU和顯卡以外的配置稍有區(qū)別,對(duì)實(shí)際表現(xiàn)影響也不大。
請(qǐng)注意,本文并非橫評(píng),也非極限性能測(cè)試,只是探討一下,在純編解碼范疇內(nèi),顯卡和CPU到底誰(shuí)更強(qiáng)。
對(duì)于編碼質(zhì)量,我已經(jīng)用OBS錄了好幾年的H265,經(jīng)過(guò)充分驗(yàn)證,現(xiàn)在的NVENC質(zhì)量直逼CPU軟壓,無(wú)須多慮,也不再進(jìn)行這方面的測(cè)試。
另外,由于我懶,本次的視頻源是H265格式,懶得再測(cè)一次H264,現(xiàn)在的電腦配置解碼小菜一碟,大部分還是吃編碼。
圖源是4K截的,所以縮放之下文字會(huì)糊,懶得重截了。
說(shuō)這么多也只是因?yàn)閲娮雍透芫?,不管了,直接?lái)看。
首先來(lái)看純CPU干活的效率,當(dāng)年H265剛出來(lái)的時(shí)候,算法不成熟加上CPU性能所限,甚至有人用0.1倍速在壓東西……而現(xiàn)在純用CPU也能達(dá)到3.2倍左右的速度。從資源占用里可以看到,CPU基本吃滿,顯卡基本快睡著了。
再來(lái)試試純顯卡壓制。此時(shí)GPU占用基本飆滿,速度飆至10.98倍,而CPU徹底成為瓶頸,一個(gè)線程都沒(méi)吃滿。現(xiàn)在知道我為什么CPU不超頻了吧,要超也是超顯卡~
接下來(lái)要進(jìn)入稍微有點(diǎn)復(fù)雜的領(lǐng)域了,就是加速解碼。顯卡、核顯除了編碼加速外,也可以提供解碼加速,理論上是可以進(jìn)一步提高整個(gè)編碼過(guò)程的速度的,不過(guò)也不是任意搭配都能用,這里也把各種方案都試試,看看哪一種最快。
這是使用Intel核顯的QSV(Quick Sync Video)幫助解碼的成績(jī),可以看到處理速度又有小提升,達(dá)到11.13倍。并且從資源管理器中可以明顯看到CPU的使用率有所提升。
這里可能有的小伙伴會(huì)有和我一樣的想法:如果能核顯和獨(dú)顯同時(shí)編碼,能不能把CPU和GPU全部跑滿呢?理論很美好,現(xiàn)實(shí)你懂的。以前曾經(jīng)有款軟件叫VIRTU MVP,可以實(shí)現(xiàn)核顯和獨(dú)顯的“交火”,后來(lái)被爆出作弊。再退一步,現(xiàn)有的軟件沒(méi)有任何一款針對(duì)這個(gè)可能性做過(guò)開(kāi)發(fā),所以我試過(guò)了,并不可行。
唯一有可能的是雙開(kāi),一個(gè)用CPU滿載的方案,一個(gè)用GPU滿載的方案,但是實(shí)測(cè)并無(wú)法達(dá)到雙滿,其中一個(gè)會(huì)被搶光資源。所以還是暫時(shí)放棄吧,等以后看會(huì)不會(huì)有軟件上的更新。
接下來(lái)我們?cè)賮?lái)看更復(fù)雜的一層。
同時(shí)有核顯和獨(dú)顯時(shí),如何使軟件或游戲正常工作,這么多年來(lái)一直困擾著不少人,然后軟件上也一直沒(méi)有一個(gè)完全的解決方案,最終還是得切換主圖形適配器。剛才說(shuō)到的QSV,在獨(dú)顯設(shè)為主圖形適配器時(shí),只能用于解碼,不能用于編碼,我已經(jīng)替你們?cè)囘^(guò)了。
所以這里,如果要加上核顯編碼的比較,就必須先來(lái)主板這里設(shè)置一下主圖形適配器,然后線最好接主板上,避免性能損耗。
核顯作為主適配器時(shí),獨(dú)顯NVENC不兼容,所以這里只能讓CPU左右互搏。
默認(rèn)設(shè)置下,CPU軟解,核顯QSV壓,速度達(dá)到8.86倍,比純CPU快很多,但是離顯卡還是有一定差距。
接下來(lái)是QSV加速解碼,QSV編碼??梢钥吹剑煽?jī)進(jìn)一步提升,到了9.46倍。
到這里先來(lái)小結(jié)一下。
首先是,目前并沒(méi)有一種方案能確保把CPU、核顯、獨(dú)顯都跑滿,雖然這樣理論上利用率最高。其實(shí)也很好理解,三種不同方案,它的編碼庫(kù)和指令集都是不一樣的,自然不可能交火串用。理論上可以多線程,比如多開(kāi),或者多個(gè)任務(wù)同時(shí)進(jìn)行,但是這樣的話,線程之前互相搶占資源,如何調(diào)配使它們滿速?目前沒(méi)有解決方案,只會(huì)出現(xiàn)反效果,互相搶占導(dǎo)致有的線程停滯。
接下來(lái)我們?cè)賮?lái)看看壓H264的成績(jī)。雖然我自己已經(jīng)全面H265化了,畢竟能省將近一半的碼率,但是現(xiàn)在還是有很多地方停留在H264的。
其實(shí)現(xiàn)在CPU的性能已經(jīng)很強(qiáng),x264的優(yōu)化基本也已經(jīng)到達(dá)頂峰了,全軟能達(dá)到10.21倍的速度。為什么說(shuō)已經(jīng)到頂了呢?
因?yàn)榧僀PU工作已經(jīng)比QSV要快了。這其中當(dāng)然有利用率的問(wèn)題,純CPU的話,CPU是滿的,而使用QSV之后,無(wú)法滿載。但是剛才也談到過(guò)了,目前并沒(méi)有靠譜的方案,能穩(wěn)定把CPU軟和核顯、獨(dú)顯同時(shí)吃滿,所以也只能這樣了。
當(dāng)然,獨(dú)顯壓制的速度仍然是最快的,CPU軟解達(dá)到了15.91倍,QSV輔助解碼則是最快的18.66倍。
用問(wèn)答的方式總結(jié)一下:
Q1:什么方案最快?
A:獨(dú)顯編碼,QSV解碼。
Q2:H265目前實(shí)用嗎?
A:我已經(jīng)用H265實(shí)時(shí)錄制了好幾年的視頻,目前無(wú)論是速度還是質(zhì)量都完全沒(méi)有問(wèn)題。你唯一該擔(dān)心的是兼容性,畢竟有的地方不支持H265。
Q3:我不玩游戲,還需要買獨(dú)顯嗎?
A:我個(gè)人覺(jué)得,不管你玩不玩游戲,都值得買一張獨(dú)顯。要玩游戲自然不用說(shuō),如果不玩游戲,說(shuō)明你是用作生產(chǎn)力工具。既然用作生產(chǎn)力工具,我怎么反而覺(jué)得更應(yīng)該買了……
Q4:多買一塊獨(dú)顯感覺(jué)性價(jià)比有些低?
A:就憑1.2-1.8倍的干活速度,我就覺(jué)得值。而且一臺(tái)電腦的配置是一個(gè)整體,不能脫離其他硬件單獨(dú)拿出來(lái)看。更何況,你還可以拿來(lái)玩游戲不是~
Q5:那我還可以讓獨(dú)顯發(fā)揮其他作用嗎?
A:現(xiàn)在很多軟件都支持顯卡加速,比如非線編軟件,AE、PR、VEGAS、EDIUS、達(dá)芬奇等,還有我沒(méi)咋用過(guò)的那些建模、渲染工具。就算是Photoshop,都支持顯卡加速。這些加速在日常使用中,可能不會(huì)有像視頻編碼那么明顯的體驗(yàn)上的區(qū)別,但它們確實(shí)在節(jié)省著你的時(shí)間。時(shí)間就是金錢(qián)呀。事實(shí)上,2020年傳出了一個(gè)不怎么引人注目的消息:NVIDIA放棄了Quadro麗臺(tái)這個(gè)品牌,最普遍的說(shuō)法就是,現(xiàn)在圖形卡和專業(yè)計(jì)算卡的界限已經(jīng)逐漸模糊。
Q6:怎么沒(méi)有匯總圖表?
A:懶。
今天的分享就到這里,感謝大家觀看,如果想了解其他內(nèi)容的話,點(diǎn)贊關(guān)注留個(gè)言唄?我們下期再見(jiàn)。
上一篇
年輕人的第一把電競(jìng)椅?入門(mén)級(jí)電競(jìng)椅選購(gòu)經(jīng)驗(yàn),附永藝UE工學(xué)椅對(duì)比
下一篇
健身理療雙重模式,和老媽共用的一把筋膜槍,JETBUS K1