日本在线看黄a美女久草|日本动漫亚洲在线一区|日韩人妻无码免费视频|A√有码中文字幕|日韩一级片视频热久久久|一区二区三区四区精品无码在线|亚洲AV成人无码一二三app|亚洲综合图片绯色|91极品人妻在线网站|国产成人精品一区二三区四区五区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
業(yè)界 正文
發(fā)私信給任然
發(fā)送

3

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

本文作者: 任然 2019-01-30 17:52
導(dǎo)語:初代“特供”型號哦~

(注:本文內(nèi)容源自Anandtech,雷鋒網(wǎng)翻譯)

對前沿半導(dǎo)體感興趣的人都知道,Intel最新的制造工藝已經(jīng)跳票許久了。10nm工藝首次發(fā)布是在2014年,最初定于2016年量產(chǎn),但卻一直延期至今。雖然首批使用10nm工藝的移動(dòng)處理器在2017年底出貨,卻是以“特供”筆記本電腦的形式與國內(nèi)一些大學(xué)合作推出。

Intel的10nm處理器屬于第8代酷睿系列,型號是i3 8121U。該處理器的ARK頁面(Intel的在線數(shù)據(jù)庫)已經(jīng)公開,其核心代號為Cannon Lake,屬于14nm Skylake核心的改良版,于2018年第二季度正式發(fā)布。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

i3 8121U的TDP為15W,雙核四線程設(shè)計(jì),基礎(chǔ)頻率2.2GHz,睿頻頻率3.2GHz。這比同為15W的14nm Kaby Lake處理器甚至還要更低一些。最為新奇的是,雖然這是一顆移動(dòng)處理器,卻支持服務(wù)器和高端桌面平臺處理器才有的AVX-512指令集,可以像企業(yè)級硬件一樣處理向量運(yùn)算。

i3 8121U的頻率不進(jìn)反退,讓人們對Intel 10nm工藝的實(shí)際性能表現(xiàn)產(chǎn)生了絲絲疑慮。雷鋒網(wǎng)從外媒SemiAccurate的一篇研究文章中獲悉,目前(指i3 8121U推出時(shí))Intel的10nm工藝還存在很多問題和困難,其收益只有10%,遠(yuǎn)低于預(yù)計(jì)中的60%,其中SAQP、COAG、Cobalt和調(diào)優(yōu)等環(huán)節(jié)遠(yuǎn)遠(yuǎn)落后于計(jì)劃和預(yù)期。

其后的幾個(gè)月,坊間傳聞Intel 10nm工藝嚴(yán)重受阻,甚至將要放棄10nm的研發(fā)工作,也有傳聞稱Intel將降低標(biāo)準(zhǔn)以實(shí)現(xiàn)這一制程,但都被Intel一一辟謠。好在今年的CES上,Intel展示了10nm工藝的全新Sunny Cove架構(gòu)Ice Lake處理器,算是讓關(guān)注新制程的人們吃了一顆定心丸。

雖然Ice Lake暫時(shí)還未落地,不過外媒Anandtech卻通過各種渠道,弄到了使用Cannon Lake處理器的“特供”筆記本電腦,并對其進(jìn)行了詳細(xì)的測試。

10nm工藝難在哪?

2017年9月,Intel在技術(shù)與制造日上展示了一個(gè)10nm Cannon Lake芯片的完整300mm晶圓,外媒Techinsights測得該芯片的芯片面積約為70.5mm2,也就是說,i3 8121U是Intel迄今為止最小的雙核處理器,但與當(dāng)時(shí)的Skylake處理器(六代酷睿)相比,i3 8121U采用了CPU和GPU分離的設(shè)計(jì),集成度更低。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

業(yè)內(nèi)衡量半導(dǎo)體工藝好壞的常用標(biāo)準(zhǔn)之一,是芯片中每平方毫米集成度晶體管數(shù)量有關(guān)。CPU中并不都是運(yùn)算晶體管,還有SRAM單元,以及一些被設(shè)計(jì)成區(qū)域間熱緩沖區(qū)的“死”硅。晶體管的計(jì)數(shù)也有不同的方法,一個(gè)2輸入的NAND邏輯單元比一個(gè)復(fù)雜的掃描觸發(fā)器邏輯單元要小得多。

Intel將單位面積上的晶體管數(shù)量劃分為2輸入NAND單元和掃描觸發(fā)器單元,其中2輸入NAND單元的晶體管密度是90.78MTr/mm2(百萬晶體管每平方毫米),掃描觸發(fā)器單元的密度為115.74 MTr/mm2,在為其賦予60/40的權(quán)重后計(jì)算出10nm工藝的晶體管密度為100.8MTr/mm2,是14nm工藝37.5MTr/mm2的2.7倍。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

Intel還在國際電子器件會議上披露,具體取決于所需的功能,10nm工藝的邏輯庫有10種類型,包括短庫(高密度庫),中高庫(高性能庫)和高庫(超高性能庫)等。庫越短,電路功耗越低,晶體管密度越高,但峰值性能也越低。因此Intel的10nm工藝其實(shí)有多種不同的密度,實(shí)際上只有密度最高的短庫可以達(dá)到100.8MTr/mm2。

在實(shí)際芯片制造中,通常會混合使用多種庫,較短的庫適用于I/O和非核心區(qū)等對性能不敏感的部位以節(jié)約成本,較高的庫通過較低的密度和較高的驅(qū)動(dòng)電流,通常使用在對性能敏感的核心區(qū)域。

為了更好的理解Intel 10nm工藝,首先要討論Fin(鰭)、Gate(柵極)、單元機(jī)制,以及定義與晶體管和FinFET相關(guān)的一些術(shù)語。

晶體管的源極-漏極由鰭(灰色)提供,該鰭穿過柵極(綠色)并嵌入氧化物中,這里的關(guān)鍵指標(biāo)是鰭的高度、寬度和柵長,半導(dǎo)體工藝的目標(biāo)是使每一個(gè)都盡可能小、單元性能盡可能高。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

Intel在其22nm工藝中,使用了包含多個(gè)鰭片的三柵極晶體管來增加總驅(qū)動(dòng)電流,以獲得更好的性能。這就引入了一個(gè)新的度量:“鰭間距”,即鰭之間的距離。如果一個(gè)鰭通過了多個(gè)柵極,柵極之間的距離稱為“柵極距”。

鰭和柵極之間接觸的越多,鰭間距越小,泄漏就越低,性能也就越好,這可以增加驅(qū)動(dòng)電流,也能控制寄生電容和柵電容。其后的14nm工藝中,鰭的高度、寬度和柵長都變得更短,每個(gè)鰭穿過的柵極也更多,因而獲得了更好的性能。

而到了10nm工藝,Intel也在積極設(shè)計(jì)鰭結(jié)構(gòu),鰭間距從42nm縮減到34nm,鰭寬度從8nm縮減至7nm以避免寄生電容。改動(dòng)看起來并不多,但在這個(gè)尺度上每nm都非常重要。Intel還通過添加共形鈦層來改善源極和漏極擴(kuò)散區(qū)域,鰭和溝槽之間的接觸區(qū)域(柵極下方的灰色尖頭)也需要讓接觸電阻最小化。在10nm工藝中,Intel將其從鎢接觸改為鈷接觸,使接觸線電阻降低了60%,種種這些改進(jìn),讓技術(shù)變得極其具有挑戰(zhàn)性。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

鰭與柵極組合起來就是基本的電路單元,從22nm制程的掃描電子顯微鏡的圖像來看,單元有6片鰭的和2片鰭的(當(dāng)然也有其他規(guī)格的),柵極長度不盡相同,每個(gè)單元內(nèi)都有活躍的鰭傳遞電流和非活躍的鰭作為間隔。

在10nm工藝上,使用高密度庫的單元總共有8個(gè)鰭,其中5個(gè)是活動(dòng)鰭,這些單元可用于I/O等不需要很高性能或?qū)Τ杀久舾械碾娐凡糠?。高性能庫和超高性能庫則分別有10個(gè)和12個(gè)鰭,各自相比前者多出一個(gè)額外的P鰭和N鰭,有助于提供額外的驅(qū)動(dòng)電流,以適當(dāng)?shù)男薁奚鼇頁Q取峰值性能的提升。

在單元之間,通常會有許多作為間隔物的偽柵極。在Intel 14nm工藝中,每個(gè)單元的兩端都有一個(gè)偽柵極,這意味著兩個(gè)單元之間會有兩個(gè)偽柵極。而在10nm工藝中,兩個(gè)相鄰的單元可以共享一個(gè)偽柵極,這將帶來更大的密度優(yōu)勢,Intel表示最多可節(jié)約20%芯片面積。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

晶體管內(nèi)部,柵極通??績芍чL度略微超出單元尺寸的觸點(diǎn)給源極和漏極加電,這不可避免的要占據(jù)額外的平面尺寸。在10nm工藝中,至少在目前Cannon Lake處理器使用的版本中,Intel通過一種被稱為“有源柵極接觸”(COAG)的設(shè)計(jì),將柵極觸點(diǎn)垂直放置在單元上。這一設(shè)計(jì)為制造過程增加了好幾個(gè)步驟(一次蝕刻、一次沉積和一次拋光),但可以為芯片提供大約10%的面積縮放。

前文已經(jīng)言道,外媒SemiAccurate上的一篇研究文章曾表示,COAG是一種風(fēng)險(xiǎn)較高的實(shí)施方案,雖然Intel已經(jīng)把它造出來并且正常工作了,但它并不像預(yù)期的那樣可靠。用于Cannon Lake核心的COAG似乎只能運(yùn)行在低性能&低功率,或高性能&高功率的工況下,希望未來Intel能在新一代10nm Ice Lake處理器正式發(fā)售時(shí)詳細(xì)說明關(guān)于COAG的改進(jìn)情況。

回到晶體管密度上,衡量晶體管密度的另一種方法是CPP*MMP,即將柵間距(接觸多晶硅間距Contact Poly Pitch)乘以鰭間距(最小金屬間距)。種種這些改進(jìn)加在一起,使Intel的CPP*MMP尺寸只有54nm*44nm,相比臺積電和三星的7nm也只是略輸一點(diǎn)點(diǎn),這也是Intel一直強(qiáng)調(diào)前兩者只是商業(yè)命名的原因。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

揭開架構(gòu)之秘

雖然i3 8121U的Cannon Lake核心仍處于NDA中,但經(jīng)過科技圈眾多同仁一年以來孜孜不倦的研究,終于還是基本揭開了其架構(gòu)的面紗。

整體而言,Cannon Lake核心的設(shè)計(jì)很像是PC端Skylake核心與服務(wù)器端Skylake-SP核心的混合體。雖然它使用了PC端標(biāo)準(zhǔn)的4+1解碼單元、8個(gè)執(zhí)行單元以及L1+L2+L3緩存結(jié)構(gòu),但也從服務(wù)器端引入了一個(gè)AVX-512單元,并且L1數(shù)據(jù)緩存的讀寫速度分別達(dá)到了每周期2*512Byte和1*512Byte。

進(jìn)一步來看,Cannon Lake核心也體現(xiàn)了一小部分第二代10nm Sunny Cove架構(gòu)的設(shè)計(jì),一些Skylake和Skylake-SP核心上沒有的指令,在Cannon Lake和Sunny Cove上都有存在。

除此之外,雖然目前不太清楚Cannon Lake核心的架構(gòu)前端設(shè)計(jì)變化,但還是可以看出重排序緩沖區(qū)的大小是與Skylake核心相同的224條微指令,而Sunny Cove架構(gòu)的大部分特性改進(jìn)(存儲帶寬加倍、執(zhí)行端口更多以及執(zhí)行端口功能改進(jìn))都沒有出現(xiàn)在Cannon Lake核心上。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

Cannon Lake支持的新指令包括IFMA(Integer fusion Multiply Add,整數(shù)融合乘加法)、VBMI(Vector Byte operation instructions,矢量字節(jié)操作指令),以及基于硬件的SHA(Secure Hash Algorithm,安全哈希算法)等。

其中,IFMA是52位整數(shù)融合乘法加法(FMA),其行為與AVX512浮點(diǎn)FMA相同,延遲為4個(gè)時(shí)鐘周期,每個(gè)時(shí)鐘周期的吞吐量為2(對于xmm/ymm/zmm為4和1)。該指令通常被用于輔助加密功能,但也意味著可以執(zhí)行任意精度的算術(shù)運(yùn)算。

VBMI指令集提供了VPERMB、VPERMI2B、VPERMT2B和VPMULTISHIFTQB四條指令,在字節(jié)混洗方案中非常有用。

而硬件加速SHA則純粹是為加密算法加速而設(shè)計(jì)的,不過測試表明,Cannon Lake核心有了它后速度仍然比Goldmont(下代Atom處理器的核心)和AMD的Zen都慢,這意味著起碼基于硬件的SHA在i3 8121U上并不是特別有用。

除了增加新指令,Intel通常還會在新核心上改進(jìn)現(xiàn)有的指令,用于增加吞吐量或減少延遲(或兩者兼而有之)。Cannon Lake核心還支持Vector-AES特性,它允許AES指令一次使用更多的AVX-512單元從而使吞吐量倍增。

在Cannon Lake核心上,最大的變化是可以硬件支持64位整數(shù)除法,不再需要分割成幾條指令,18個(gè)時(shí)鐘周期內(nèi)就可以完成64bit的IDIV。相比之下,Zen執(zhí)行同樣的運(yùn)算需要45個(gè)時(shí)鐘周期,Skylake核心則需要97時(shí)鐘周期。

對于字符串的塊存儲,所有REP STOS*系列指令都可以使用512bit執(zhí)行寫入端口,吞吐量為每時(shí)鐘周期61bit,相比之下,Skylake-SP為43bit,Skylake為31bit,Zen為14bit。

對于全字整數(shù)矢量,AVX512BW命令VPERMW的等待時(shí)間從6個(gè)時(shí)鐘周期減小到4個(gè),并且每個(gè)時(shí)鐘的吞吐量增加一倍。與向量類似,使用VMOVSS和VMOVSD命令移動(dòng)或合并單/雙精度標(biāo)量的向量現(xiàn)在與其他MOV命令的行為相同。

對指令集的其他有益調(diào)整包括使ZMM劃分和平方根更快一個(gè)時(shí)鐘,并將一些GATHER函數(shù)的吞吐量從每四個(gè)時(shí)鐘一個(gè)增加到每三個(gè)時(shí)鐘一個(gè);回歸則以舊x87指令的形式出現(xiàn),其中x87 DIV、SQRT、REP CMPS、LFENCE和MFENCE都變慢一了個(gè)時(shí)鐘,其他指令則慢的更多,目的是讓人們棄用這些老舊的指令。

Cannon Lake核心相對不足的地方包括:VPCONFLICT*命令具有3個(gè)時(shí)鐘周期的延遲,吞吐量為每時(shí)鐘周期一條,速度仍然很慢;DWORD ZMM表單的延遲為26個(gè)時(shí)鐘,吞吐量為每20個(gè)時(shí)鐘1個(gè);不支持Skylake-SP核心的緩存行寫回功能CLWB;不支持SGX(軟件保護(hù)擴(kuò)展)。

處理器規(guī)格對比

在i3 8121U的測試中,使用i3 8130U移動(dòng)處理器作為對比,這是一款Kaby Lake核心的雙核四線程處理器,使用14nm工藝制造,TDP同樣為15W,基礎(chǔ)頻率與i3 8121U相同,睿頻頻率則反而要稍高一些。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

對于這種15W TDP的移動(dòng)處理器,會很容易撞上溫度墻導(dǎo)致降頻。測試中i3 8121U降頻非常頻繁,在AVX2應(yīng)用中干脆是運(yùn)行在2.2GHz的基準(zhǔn)頻率狀態(tài),AVX-512應(yīng)用中甚至?xí)殿l至基準(zhǔn)線以下的1.8GHz。

相比之下,使用14nm成熟工藝的i3 8130U在AVX2應(yīng)用中仍能維持2.8GHz的頻率,比如在POV-Ray測試項(xiàng)中,i3 8130U可以更快的完成測試,性能相比i3 8121U高出26%。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

不過盡管i3 8121U在運(yùn)行AVX-512應(yīng)用時(shí)頻率很低,但先進(jìn)的指令集仍然帶來了出色的性能,在3DPM測試中,開啟AVX-512指令集的i3 8121U在1.8GHz下成績?yōu)?846分,6倍于2.8GHz但只支持AVX2指令集的i3 8130U。

內(nèi)存性能和功耗測試

在緩存/內(nèi)存延遲測試中,i3 8121U和i3 8130U處理器都禁用了睿頻,迫使它們以相同的2.2 GHz頻率運(yùn)行,以便進(jìn)行奇偶性和直接的架構(gòu)比較。Cannon Lake核心的緩存/內(nèi)存子系統(tǒng)與Skylake核心相同的,沒有任何其他改進(jìn),理論上表現(xiàn)出的性能也應(yīng)該基本相同。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

在這項(xiàng)測試中,兩顆處理器的緩存訪問延遲幾乎相同,但Cannon Lake核心的i3 8121U的內(nèi)存訪問延遲要高出Kaby Lake核心的i3 8130U多達(dá)50%,一上來就震驚了四座(當(dāng)然這不是啥好事)。

盡管為i3 8121U配套的DDR4 2400內(nèi)存時(shí)序17-17-17,略輸于i3 8130U的16-16-16,但這一丟丟時(shí)序差異遠(yuǎn)不足以有如此大的影響,能想到的唯一原因是,Cannon Lake核心訪問內(nèi)存控制器有非常大的額外開銷,這或許就是封堵了幽靈和熔斷漏洞的副作用。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

而功耗方面比較撲朔迷離,我們知道,Intel在處理器硬件中設(shè)置了兩個(gè)關(guān)鍵的功耗限制——PL1和PL2,前者控制穩(wěn)態(tài)功耗,后者控制短時(shí)間睿頻功耗。

在大多數(shù)情況下,處理器的穩(wěn)態(tài)功耗和TDP相同,如i3 8130U就是這樣,處理器的穩(wěn)態(tài)功耗為15W,然而同為15W TDP的i3 8121U的穩(wěn)態(tài)功耗僅為12.6W。由PL2控制的峰值功耗也是同樣,i3 8130U的峰值功耗可以達(dá)到24.2 W,而i3 8121U最高只能沖到18.7W,且睿頻的持續(xù)時(shí)間也要比i3 8130U短很多。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

糟心的是,雖然i3 8121U的功耗墻更低,但由于其頻率更低性能更差,實(shí)際執(zhí)行運(yùn)算所消耗的能量反而更多。在POV-Ray測試項(xiàng)中,Kaby Lake核心的i3 8130U的總耗能只有768 mWh,而Cannon Lake核心的i3 8121U的總耗能為867mWh,足足高了12.9%。

2.2GHz同頻測試:SPEC2006

除了功耗,關(guān)于Cannon Lake核心的另一個(gè)問題在于它是否是一個(gè)高效的架構(gòu)設(shè)計(jì)。為了進(jìn)行直接的IPC比較,我們將兩顆處理器固定住2.2 GHz同頻率上運(yùn)行SPEC2006 測試。

SPEC2006是一個(gè)重要的基準(zhǔn)測試軟件,它與其他測試軟件的區(qū)別在于所處理的數(shù)據(jù)集更大更復(fù)雜。作為基準(zhǔn)測試更有代表性,它可以充分展示架構(gòu)的更多細(xì)節(jié)。

從測試結(jié)果來看,兩款不同核心的處理器性能相差無幾,Kaby Lake核心的i3 8130U在與SIMD相關(guān)的462.libquantum和470.lbm測試項(xiàng)中似乎比Cannon Lake核心的i3 8121U更有優(yōu)勢,這也許與二者內(nèi)存延遲性能有關(guān)。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

2.2GHz同頻測試:系統(tǒng)綜合性能

系統(tǒng)測試部分重點(diǎn)關(guān)注實(shí)際用戶體驗(yàn),將包括應(yīng)用加載時(shí)間、圖像處理、簡單科學(xué)物理、仿真、神經(jīng)仿真、優(yōu)化計(jì)算和3D模型開發(fā)等測試項(xiàng)。

GIMP應(yīng)用加載時(shí)間

系統(tǒng)響應(yīng)速度是最關(guān)乎用戶體驗(yàn)的指標(biāo),一個(gè)很好的測試用例是看應(yīng)用加載需要多長時(shí)間。在這一測試中,Cannon Lake核心的i3 8121U表現(xiàn)的特別好。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

FCAT圖像處理

FCAT軟件采用錄制的視頻,并將顏色數(shù)據(jù)處理成幀時(shí)間數(shù)據(jù),以便系統(tǒng)可以繪制可視化的幀率。

這一測試是單線程的,在基準(zhǔn)頻率下,Cannon Lake核心的i3 8121U與Kaby Lake核心的i3 8130U耗時(shí)差距在半秒之內(nèi),i3 8121U略微領(lǐng)先。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

3DPM粒子運(yùn)動(dòng)計(jì)算

3DPM測試是一個(gè)定制的基準(zhǔn)測試,旨在模擬3D空間中六個(gè)點(diǎn)的不同粒子運(yùn)動(dòng)算法。算法的一個(gè)關(guān)鍵部分是使用了相對快速的隨機(jī)數(shù)生成,最終在代碼中實(shí)現(xiàn)依賴鏈。在這一測試中,我們在六種算法上運(yùn)行一個(gè)原子粒子集,每次20秒,暫停10秒,并報(bào)告粒子移動(dòng)的總速率,以每秒數(shù)百萬次運(yùn)動(dòng)為單位。

在不啟動(dòng)AVX,Cannon Lake核心的i3 8121U敗給了Kaby Lake核心的i3 8130U。但各自啟動(dòng)AVX后,i3 8121U竟然跑出了4519的超高分,甚至擊敗了4185分的18核Core i9 7980XE處理器,非常瘋狂。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

Dolphin 5.0模擬器

Dolphin 5.0是一款GameCube/Wii主機(jī)模擬器,可以在PC上玩到這些老款游戲主機(jī)的獨(dú)占大作。不過,模擬這兩臺使用Power架構(gòu)處理器的主機(jī)通常需要一顆不弱的處理器才行。

在這一測試中,兩款處理器的同頻性能大致相同。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

DigiCortex海蛞蝓大腦模擬

DigiCortex基準(zhǔn)測試最初設(shè)計(jì)用于神經(jīng)元和突觸活動(dòng)的模擬和可視化,該軟件具有多種基準(zhǔn)模式,本次使用小基準(zhǔn)測試,模擬32000個(gè)神經(jīng)元和18億個(gè)突觸,規(guī)模相當(dāng)于海蛞蝓的大腦。

模擬類型分為“非激發(fā)”和“激發(fā)”兩種模式,前者受內(nèi)存影響更大,后者更依賴純粹的處理器性能。測試中使用了后者,兩款處理器的同頻性能大致相同。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

y-Cruncher科學(xué)計(jì)算

y-Cruncher是一款幫助計(jì)算各種數(shù)學(xué)常數(shù)的工具,軟件支持通過二進(jìn)制、單線程和多線程等不同優(yōu)化方式運(yùn)行,甚至包括AVX-512優(yōu)化的二進(jìn)制文件。本次測試基于單線程和多線程方式,計(jì)算2.5億位圓周率。

測試結(jié)果不出意外是 Cannon Lake核心的i3 8121U獲勝,到目前為止,所有可以利用AVX-512指令集的軟件都是i3 8121U獲勝。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

Agisoft Photoscan 2D圖像轉(zhuǎn)3D模型

PhotoScan可以將許多2D圖像轉(zhuǎn)換為3D模型,這是模型開發(fā)和歸檔中的一個(gè)重要工具,依賴于許多單線程和多線程算法。

測試使用了PhotoScan v1.3.3版本,其中包含了84 x 1800萬像素的大數(shù)據(jù)集,通過一個(gè)相當(dāng)快速的算法變體,最后對比轉(zhuǎn)換過程總時(shí)間。

在這一測試中,兩款處理器的同頻性能大致相同。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

2.2GHz同頻測試:渲染性能

渲染性能通常是處理器在專業(yè)環(huán)境下的關(guān)鍵指標(biāo),從3D渲染到光柵化,涵蓋網(wǎng)格、紋理、碰撞、鋸齒、物理等方面。大多數(shù)渲染器都支持CPU渲染,少數(shù)可以支持GPU或FPGA和ASIC等專用芯片。對于大型工作室來說,CPU仍然是首選的硬件。

Corona 1.3渲染

Corona是3DS Max和Cinema 4D等軟件的高級性能渲染器,基準(zhǔn)測試的GUI可顯示正在構(gòu)建的場景,并將渲染時(shí)間反饋給用戶。

本次測試使用了直接輸出結(jié)果的命令行版本,輸出的結(jié)果也不是報(bào)告時(shí)間,而是報(bào)告六次運(yùn)行中每秒的平均光線數(shù),因?yàn)閱挝粫r(shí)間內(nèi)的性能比例通常更容易理解。

Corona只支持到AVX2指令集,無法充分發(fā)揮Cannon Lake 核心的特性。在這一測試中,i3 8121U同頻性能落后i3 8130U約10%。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

Blender 3D創(chuàng)作軟件

Blender是一個(gè)開源的高級渲染工具,支持大量可配置項(xiàng),被世界上許多知名的動(dòng)畫工作室所使用。該軟件的開發(fā)小組最近發(fā)布了一個(gè)基準(zhǔn)測試包,本次測試通過命令行運(yùn)行該套件中的“bmw27”場景子測試,并測量完成渲染的時(shí)間。

Blender同樣只支持到AVX2指令集,在這一測試中,兩款處理器的同頻性能大致相同,Cannon Lake 核心的i3 8121U有微弱優(yōu)勢。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

LuxMark引擎

使用LuxRender引擎開發(fā)的基準(zhǔn)測試提供了幾個(gè)不同的場景和API,本次測試選擇在C ++和OpenCL代碼路徑上運(yùn)行簡單的“Ball”場景,以粗略渲染開始,并在兩分鐘內(nèi)慢慢提高質(zhì)量,最終結(jié)果以每秒渲染的光線數(shù)展示。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

POV-Ray光線追蹤

Persistence of Vision光線追蹤引擎是另一個(gè)眾所周知的基準(zhǔn)測試工具,在AMD發(fā)布Ryzen處理器之前一直默默無聞,而后Intel和AMD都開始向開源項(xiàng)目的主要分支提交代碼。

本次測試使用從命令行調(diào)用所有內(nèi)核的內(nèi)置基準(zhǔn)。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

2.2GHz同頻測試:辦公性能

Office測試套件旨在專注于更多行業(yè)標(biāo)準(zhǔn),如辦工流程和系統(tǒng)會議等,但是我們也將編譯器性能捆綁在本節(jié)中。對于必須對硬件進(jìn)行總體評估的用戶來說,這些通常是最需要考慮的基準(zhǔn)測試。

3DMark物理計(jì)算

游戲測試軟件3DMark的每個(gè)測試場景均包括一個(gè)物理測試子項(xiàng)。按復(fù)雜程度排列的依次為Ice Storm、Cloud Gate、Sky Diver、Fire Strike和Time Spy。

在所有測試場景中,兩款處理器的同頻性能都大致相同。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

GeekBench 4

GeekBench 4是常用的跨平臺測試工具,重點(diǎn)尋求峰值吞吐量的一系列算法,包括加密、壓縮、快速傅里葉變換、存儲器操作、n體物理、矩陣運(yùn)算、直方圖處理和HTML解析等,常用于移動(dòng)設(shè)備測試。

考慮到其通用性和流行程度,本次也加入了這款軟件的單線程和多線程測試。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

2.2GHz同頻測試:編碼性能

隨著流媒體和短視頻內(nèi)容的興起,越來越多的家庭用戶和游戲玩家需要將視頻文件進(jìn)行轉(zhuǎn)換,處理器的編碼和轉(zhuǎn)碼性能變得越來越重要,本次編碼測試也主要圍繞這些重要的場景進(jìn)行。

Handbrake視頻轉(zhuǎn)碼

Handbrake是一種流行的開源視頻轉(zhuǎn)換軟件,最新的版本可利用AVX-512和OpenCL來加速某些類型的轉(zhuǎn)碼和算法。本次測試使用的CPU轉(zhuǎn)碼。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

7-Zip壓縮解壓

在壓縮/解壓應(yīng)用中,開源的7-Zip是很歡迎的工具之一。本次猜測是使用最新的v18.05版本,它內(nèi)置有基準(zhǔn)測試,從命令行運(yùn)行基準(zhǔn)測試,報(bào)告壓縮、解壓縮和綜合得分。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

WinRAR壓縮解壓

在大多數(shù)人的系統(tǒng)中通常都有WinRAR,它是20多年前的第一批壓縮解壓工具之一。它沒有內(nèi)置基準(zhǔn)測試,本次使用一個(gè)包含超過30個(gè)60秒視頻文件和2000個(gè)零碎小文件的文件夾,以正常壓縮率運(yùn)行壓縮。

WinRAR是可變線程的,但也容易受到緩存的影響,因此測試需運(yùn)行它10次并取最后五次的平均值,使結(jié)果可以展示CPU純粹的原始計(jì)算性能。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

AES加密

許多移動(dòng)設(shè)備默認(rèn)使用的文件系統(tǒng)都提供了加密功能以保護(hù)內(nèi)容,PC上的Windows也有,通常由BitLocker或第三方軟件應(yīng)用。本次使用已停產(chǎn)的TrueCrypt作為其內(nèi)置基準(zhǔn)測試,可直接在內(nèi)存中測試多種加密算法,支持AES指令集但不支持AVX-512。測試采用的數(shù)據(jù)是AES加密/解密組合,以每秒千兆字節(jié)為單位。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

雷鋒網(wǎng)總結(jié)

Intel在10nm工藝上確實(shí)進(jìn)行了很多改進(jìn),如果每一步都能完美運(yùn)行,那么10nm應(yīng)該在去年就成了??蓡栴}是在半導(dǎo)體設(shè)計(jì)中,有幾百個(gè)不同的特性,改動(dòng)任何一個(gè)都可能會導(dǎo)致其他幾個(gè)甚至幾十個(gè)特性變差,這正是Intel在10nm工藝方面遇到的最大問題。

仍記得2018年的CES上,Intel對10nm工藝相關(guān)的問題緘口不言,從這曇花一現(xiàn)的Cannon Lake核心來看,唯一稱得上亮眼的表現(xiàn)只有AVX-512性能,很明顯第一代10nm還遠(yuǎn)遠(yuǎn)沒有準(zhǔn)備好邁入黃金時(shí)段,Intel是在試圖冷處理這一代處理器,也肯定不會正式公開發(fā)售它們。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

在Intel給出的這張圖中,右側(cè)顯示10nm工藝及其改型可依靠較低的動(dòng)態(tài)電容擁有較低的功率,然而數(shù)軸的左側(cè)則顯示10nm和10nm+工藝的單個(gè)晶體管性能其實(shí)還要低于當(dāng)前的14nm++工藝,要到下下下一代的10nm++工藝才能真正實(shí)現(xiàn)全面領(lǐng)先,而從i3 8121U的表現(xiàn)來看,很大概率上也意味著在第三代10nm++工藝實(shí)施之前,業(yè)界很可能都無法看到真正突破性的10nm處理器(一竿子支到三零零零年了……)。

預(yù)計(jì)將在今年下半年問世的Ice Lake處理器會使用第二代10nm+工藝,電氣性能將非常接近14nm++工藝,或許那時(shí)Intel在10nm工藝上打響真正的第一炮吧。

雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:

編輯

觀點(diǎn)離經(jīng)叛道的骨灰級硬件愛好者
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個(gè)人簡介
為了您的賬戶安全,請驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說