來(lái)源:太平洋電腦網(wǎng)
作者| Aimo
蘋(píng)果M1處理器在去年驚艷亮相,在桌面環(huán)境下表現(xiàn)出了驚人的性能和效率,ARM陣營(yíng)可謂是揚(yáng)眉吐氣。而今年,似乎要輪到x86陣營(yíng)反擊了。英特爾將會(huì)在今年推出全新架構(gòu)設(shè)計(jì)的x86處理器Alder Lake,它的革命性之處,在于使用了ARM中實(shí)裝多年的大小核架構(gòu)。
Alder Lake使用了大小核混合架構(gòu),在不同平臺(tái)對(duì)應(yīng)有不同規(guī)格
高性能大核+高效率小核的組合,已經(jīng)被證明的確可以帶來(lái)更好的體驗(yàn)。然而這樣的設(shè)計(jì),在x86陣營(yíng)中鳳毛麟角,之前的評(píng)價(jià)體系對(duì)于Alder Lake來(lái)說(shuō),或許是不夠精確的。那么要如何才能客觀評(píng)價(jià)Alder Lake?待到Alder Lake正式發(fā)布、以第12代酷睿處理器的正式產(chǎn)品名登場(chǎng)時(shí),要如何跑分才能更科學(xué)?今天就給大家分享幾個(gè)思路吧。
用適合的操作系統(tǒng)跑分
如果你這幾年有關(guān)注AMD的銳龍?zhí)幚砥?,那么?yīng)該知道操作系統(tǒng)的調(diào)度,對(duì)于CPU的性能影響是非常大的。無(wú)論是對(duì)于銳龍也好,Alder Lake也好,架構(gòu)的改變,需要操作系統(tǒng)采用新的調(diào)度算法,才能發(fā)揮CPU應(yīng)有的性能。
以銳龍CPU為例。銳龍之所以可以輕易推高核心數(shù)量,和它獨(dú)特的拓?fù)浼軜?gòu)密不可分。例如在Zen 2中,每4個(gè)核心封裝成為一個(gè)CCX,每?jī)蓚€(gè)CCX封裝為一個(gè)CCD,這樣的好處是可以通過(guò)簡(jiǎn)單增加CCX和CCD模塊,堆砌出更多核心。
AMD Zen2的架構(gòu),可以看到核心-CCX-CCD的拓?fù)?/p>
但是,這樣的架構(gòu)帶來(lái)了CPU調(diào)度的新問(wèn)題,例如核心和核心直接的通訊,會(huì)出現(xiàn)跨CCX乃至跨CCD的情況,而跨CCX的核心之間通訊,會(huì)產(chǎn)生額外的延遲。例如一個(gè)程序用了CPU兩個(gè)核心,但這兩個(gè)核心有可能位于同一個(gè)CCX,也有可能分別位于不同的CCX中,后一種情況會(huì)帶來(lái)更高的通訊延遲,性能數(shù)據(jù)自然遜于前一種情況了。
在Win10 1903中,系統(tǒng)對(duì)此進(jìn)行了優(yōu)化,Win10 1903系統(tǒng)會(huì)優(yōu)先調(diào)度處于同一CCX內(nèi)的核心,避免跨CCX造成的延遲,多核性能有所提升。
Windows 10 1903對(duì)Zen架構(gòu)的優(yōu)化:優(yōu)先調(diào)用同一CCX內(nèi)的核心、縮短頻率響應(yīng)時(shí)間
Windows 10 1903可以提升Zen的游戲性能和日常表現(xiàn)
這次Alder Lake也會(huì)遇到和銳龍類(lèi)似的問(wèn)題。Alder Lake使用了大小核混合架構(gòu),操作系統(tǒng)必須足夠聰明,才能準(zhǔn)確判斷什么時(shí)候使用小核心,什么時(shí)候調(diào)用大核心。很遺憾,由于桌面處理器現(xiàn)在才開(kāi)始使用大小核設(shè)計(jì),因此當(dāng)前的Windows系統(tǒng)都沒(méi)有對(duì)其優(yōu)化,想要發(fā)揮出Alder Lake這樣的大小核架構(gòu)的威力,就需要升級(jí)到Windows 11了。
在Alder Lake中,英特爾部署了Intel Thread Director的硬件調(diào)度技術(shù),結(jié)合適合的操作系統(tǒng),可以對(duì)線(xiàn)程智能分配到合適的核心當(dāng)中。而Windows 11,就對(duì)這項(xiàng)技術(shù)提供了較好的支持。
實(shí)際上,已經(jīng)有媒體測(cè)試對(duì)比過(guò)Win11和Win10在大小核混合架構(gòu)CPU平臺(tái)下的性能差異。媒體使用了三星Galaxy Book S設(shè)備,它基于Lakefield Core i5-L16G7平臺(tái),而Lakefield就是典型的大小核設(shè)計(jì)的CPU,可以將其看作是Alder Lake的前哨。下面是具體的測(cè)試結(jié)果。
首先是GeekBench 5測(cè)試,Win11相比Win10 21H1,在多線(xiàn)程上有5.8%的優(yōu)勢(shì),在單線(xiàn)程上則有2%的優(yōu)勢(shì)。Win11的性能對(duì)比Win10 21H2更好,但提升幅度并不算令人振奮,期待最終版能有更好的表現(xiàn)。
接著是瀏覽器跑分Speedmeter 2,測(cè)試也顯示W(wǎng)in11的性能要更好。使用同樣的Chrome 91,Win11對(duì)比Win10 21H1有10%的性能優(yōu)勢(shì)。
再來(lái)看渲染成績(jī)。在Cinebench R23中,Win11在單線(xiàn)程測(cè)試中呈現(xiàn)出了約8.2%的優(yōu)勢(shì)。這個(gè)測(cè)試結(jié)果是通過(guò)三種不同的測(cè)試得出的,而Core i5-L16G7這顆處理器的確在Win11中表現(xiàn)出了更強(qiáng)的性能。
最后是3DMark測(cè)試,該測(cè)試中沒(méi)有呈現(xiàn)出顯著的性能差異,這也是可以理解的——3DMark對(duì)驅(qū)動(dòng)依賴(lài)較大,而新系統(tǒng)和新硬件都尚未有完善的驅(qū)動(dòng)匹配。
可以看到,Win11在大小核CPU平臺(tái)上,發(fā)揮出了顯著優(yōu)于Win10的性能,這會(huì)給游戲帶來(lái)更高的幀數(shù)、更低的延遲和更少的卡頓——對(duì)大小核架構(gòu)優(yōu)化不足,是有可能讓異架構(gòu)核心切換延遲明顯增加的,而Win11顯然對(duì)大小核優(yōu)化更好。
總的來(lái)說(shuō),要發(fā)揮出新CPU的性能,就需要使用對(duì)架構(gòu)有優(yōu)化的操作系統(tǒng)。Alder Lake和Win11正式版都會(huì)在年底發(fā)布,如果大家打算用Alder Lake,可別忘了配備新系統(tǒng)了。
用適合的測(cè)試軟件跑分
Alder Lake使用了大小核設(shè)計(jì),而根據(jù)目前公布的信息,桌面平臺(tái)的會(huì)是8+8核心,筆記本移動(dòng)平臺(tái)的也會(huì)擁有6+8以及2+8核心。和當(dāng)前的英特爾CPU相比,Alder Lake無(wú)疑屬于核心數(shù)量爆炸,在某些性能測(cè)試軟件,成績(jī)會(huì)有極大程度的提高,但要如何理解這個(gè)測(cè)試成績(jī)呢?
例如Cinebench,這是一個(gè)DIY玩家很常用的跑分軟件,它通過(guò)渲染測(cè)試來(lái)衡量CPU性能,對(duì)多核心優(yōu)化較好,通常來(lái)說(shuō)核心數(shù)量多的CPU在Cinebench中更容易取得好成績(jī)。Alder Lake的核心數(shù)量提升很大,可以預(yù)見(jiàn)的是在Cinebench中會(huì)跑出遠(yuǎn)勝于前的成績(jī),但這是否意味著Alder Lake對(duì)比前代提升就有那么大?
Alder Lake一定會(huì)在Cinebench這樣的測(cè)試中有大幅提升,但這是否意味著日常使用也提升很大?
Cinebench測(cè)試的是CPU多核在高負(fù)載下的峰值性能,但未必符合日常使用的場(chǎng)景。例如打開(kāi)一個(gè)網(wǎng)頁(yè),實(shí)際上更考驗(yàn)的是CPU的瞬時(shí)響應(yīng)速度,尤其是Alder Lake這種大小核架構(gòu)的CPU,加上可變頻率設(shè)計(jì),能否在第一時(shí)間響應(yīng)任務(wù)、攀升到較理想的性能去完成用戶(hù)觸發(fā)的輕量任務(wù),或許更加影響用戶(hù)日常體驗(yàn)。
Alder Lake使用高達(dá)1000GB/s的總線(xiàn)連接大小核,但沒(méi)有明說(shuō)延遲如何,延遲會(huì)極大影響日常體驗(yàn)
因此,對(duì)于CPU,還是需要使用更多的跑分工具去測(cè)試,例如PCMark就可以測(cè)試CPU對(duì)輕量任務(wù)的響應(yīng)速度。評(píng)價(jià)CPU性能,特別是Alder Lake這種架構(gòu)大改的產(chǎn)品,不能迷信一兩款測(cè)試工具,而是需要針對(duì)CPU的特性,進(jìn)行更多維度的測(cè)試,才能獲得更客觀的結(jié)論。
使用合適的編譯器跑分
盡管x86 CPU的指令集是兼容的,但實(shí)現(xiàn)指令集的具體方法,卻有所區(qū)別。對(duì)此,一些針對(duì)處理器的代碼優(yōu)化,可以更完美地發(fā)揮出CPU應(yīng)有的性能。例如編譯器,同樣的測(cè)試程序,如果使用對(duì)CPU更友好的編譯器,結(jié)果可能大有不同。